Из Википедии, бесплатной энциклопедии
  (Перенаправлено с ISO 646 )
Перейти к навигации Перейти к поиску

ISO / IEC 646 - это название набора стандартов ISO , описываемых как « Информационные технологии» - набор 7-битных кодированных символов ISO для обмена информацией, разработанных в сотрудничестве с ASCII, по крайней мере, с 1964 года. [1] [2] С момента его первого издания. в 1967 г. [3] он определил 7- битный символьный код, на основе которого основаны несколько национальных стандартов.

ISO / IEC 646 также был ратифицирован ECMA как ECMA-6 . Первая версия ECMA-6 была опубликована в 1965 году [4] на основе работы, которую Технический комитет ECMA TC1 проводил с декабря 1960 года. [4]

Символы в базовом наборе символов ISO / IEC 646 являются неизменяемыми символами . [5] Поскольку в той части ISO / IEC 646, которая является неизменным набором символов, общим для всех стран, указаны только те буквы, которые используются в базовом латинском алфавите ISO , страны, использующие дополнительные буквы, необходимые для создания национальных вариантов ISO 646, чтобы иметь возможность использовать свои родные скрипты. Поскольку передача и хранение 8-битных кодов в то время не были стандартом, национальные символы должны были соответствовать ограничениям в 7 бит, а это означало, что некоторые символы, которые появляются в ASCII , не появляются в других национальных вариантах ISO 646. .

История [ править ]

Ранний ASCII ( ASA X3.4 : 1963)

ISO / IEC 646 и его предшественник ASCII ( ASA X3.4 ) в значительной степени одобряли существующую практику кодирования символов в телекоммуникационной отрасли.

US-ASCII или ISO 646: США

Поскольку ASCII не предоставлял ряд символов, необходимых для языков, отличных от английского, был сделан ряд национальных вариантов, в которых некоторые менее используемые символы были заменены необходимыми. Из-за несовместимости различных национальных вариантов была введена Международная справочная версия (IRV) ISO / IEC 646 в попытке, по крайней мере, ограничить заменяемый набор одними и теми же символами во всех вариантах. Исходная версия (ISO 646 IRV) отличалась от ASCII только тем, что кодовая точка 0x24, знак доллара ASCII ($) был заменен символом международной валюты (¤). Последняя версия кода ISO 646: 1991 1991 года также известна как ITU T.50 , International Reference Alphabet или IRA, ранееМеждународный алфавит № 5 (IA5). Этот стандарт позволяет пользователям использовать 12 переменных символов (т. Е. Два альтернативных графических символа и 10 национальных символов). Среди этих упражнений ISO 646: 1991 IRV (Международная справочная версия) явно определен и идентичен ASCII . [6]

Серия стандартов ISO 8859, регулирующих 8-битные кодировки символов, заменяет международный стандарт ISO 646 и его национальные варианты, предоставляя 96 дополнительных символов с дополнительным битом и, таким образом, избегая любой замены кодов ASCII. Стандарт ISO 10646 , непосредственно связанный с Unicode , заменяет все наборы ISO 646 и ISO 8859 одним унифицированным набором кодировок символов с использованием большего 21-битного значения.

ISO 646: JP

Унаследованный ISO / IEC 646 виден в Windows, где во многих странах Восточной Азии символ обратной косой черты, используемый в именах файлов , отображается как ¥ или другие символы, такие как ₩ . Несмотря на то, что другой код для ¥ был доступен даже на исходной кодовой странице 437 IBM PC , а отдельный двухбайтовый код для ¥ доступен в Shift JIS (хотя при этом часто используется альтернативное сопоставление ), так много текста было создано с помощью код обратной косой черты, используемый для ¥ (из-за того, что Shift_JIS официально основан на ISO 646: JP, хотя Microsoft отображает его как ASCII), что даже современные шрифты Windows сочли необходимым отображать код таким образом. Аналогичная ситуация существует с ₩ иEUC-KR . Еще одно наследия существование триграфов в языке программирования Си .

Опубликованные стандарты [ править ]

  • ISO / R646-1967 [3]
  • ISO 646: 1972 [7]
  • ISO 646: 1983 [8]
  • ИСО / МЭК 646: 1991 [7] [9]
  • ECMA-6 (1965-04-30), первое издание [4]
  • ECMA-6 (1967-06), второе издание [3] [4]
  • ECMA-6 (1970-07), третье издание [4] [10]
  • ECMA-6 (1973-08), четвертое издание [4] [10]
  • ECMA-6 (1984-12, 1985-03), пятое издание [4]
  • ECMA-6 (1991-12, 1997-08), шестое издание [7]

Макет кодовой страницы [ править ]

В следующей таблице показан неизменный набор символов ISO / IEC 646. Каждый символ отображается с шестнадцатеричным кодом его эквивалента в Юникоде . Национальные кодовые точки отображаются серым цветом с заменяемым символом ASCII. Жирный прямоугольник обозначает символ, который в некоторых регионах может быть объединен с предыдущим символом в качестве диакритического знака с использованием символа возврата , что может повлиять на выбор глифа .

В дополнение к ограничениям на инвариантный набор, 0x23 ограничен как # или £, а 0x24 ограничен как $ или ¤ в ECMA-6: 1991, что эквивалентно ISO 646: 1991. [11] Однако эти ограничения соблюдаются не во всех национальных вариантах. [12] [13]

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Связанные семейства кодировок [ править ]

Набор национальных замещающих символов [ править ]

Национальный Замена Набор символов ( NRCS ) представляет собой семейство 7-битных кодировок , введенных в 1983 году DEC с VT200 серии компьютерных терминалов. Он тесно связан с ISO 646, поскольку основан на аналогичном инвариантном подмножестве ASCII, но отличается сохранением в $качестве инварианта, но не _(хотя большинство вариантов NRCS сохраняют _и, следовательно, соответствуют набору инвариантов ISO 646). Большинство вариантов NRCS тесно связаны с соответствующими национальными вариантами ISO 646 там, где они существуют, за исключением голландского варианта .

Телетекст Мировой Системы [ править ]

В европейских телекоммуникаций стандарт ETS 300 706, «Enhanced спецификации телетекст», определяет латинский, греческий, кириллица, арабский и иврит кодовые наборы с несколькими национальными вариантами как для латиницы и кириллицы. [14] Подобно NRCS и ISO 646, в латинских вариантах семейство кодировок, известное как набор G0 , основано на аналогичном инвариантном подмножестве ASCII, но не сохраняется $ни _как инвариантное, ни как инвариантное. В отличие от NRCS, варианты часто значительно отличаются от соответствующих национальных вариантов ISO 646.

Коды и описания вариантов [ править ]

Национальные варианты ISO 646 [ править ]

Некоторые национальные варианты ISO 646 следующие:

Национальные производные [ править ]

Также существуют некоторые национальные наборы символов, основанные на ISO 646, но не строго следующие его инвариантному набору (см. Также § Производные для других алфавитов ):

Управляющие символы [ править ]

Все варианты, перечисленные выше, являются исключительно графическими наборами символов и должны использоваться с набором управляющих символов C0, например, перечисленным в следующей таблице:

Связанные дополнительные наборы символов [ править ]

В следующей таблице перечислены дополнительные наборы графических символов, определенные тем же стандартом, что и конкретные варианты ISO 646. Их можно выбрать с помощью такого механизма, как сдвиг вне или суперсдвиг NATS (одинарный сдвиг) [48], или путем установки восьмого бита в средах, где он доступен:

Таблица сравнения вариантов [ править ]

Особенности изменений для некоторых из этих вариантов приведены в следующей таблице. Неизмененные назначения символов во всех перечисленных вариантах (т. Е. Те, которые остаются такими же, как ASCII), не отображаются.

Для простоты сравнения, подробные варианты включают национальные варианты ISO 646, серию тесно связанных наборов национальных заменяемых символов (NRCS) DEC, используемых на терминалах VT200 , соответствующие серии кодирования телетекста European World System, определенные в ETS 300706, и несколько других тесно связанных кодировки, основанные на ISO 646. Индивидуальные кодовые таблицы связаны из второго столбца. Ячейки с небелым фоном подчеркивают отличия от US-ASCII (также подмножества Basic Latin в ISO / IEC 10646 и Unicode).

Несколько символов могут использоваться как объединяющие символы , если перед ними или после них стоит элемент управления C0 возврата . Это засвидетельствовано в таблицах кодов для IRV, GB, FR1, CA и CA2, которые отмечают, что они будут вести себя как диэрезис , острый акцент , седиль и циркумфлекс (а не кавычки , запятая и направленная вверх стрелка ), когда им предшествуют или следуют пробелом. Символ тильды (~) был введен аналогично как диакритический знак (˜). Этот метод кодирования возник в пишущей машинке / телетайпе."',^эра, когда использование backspace могло бы заменить глиф и может считаться устаревшим .

Позже, когда более широкие наборы символов получили большее распространение, ISO 8859 , наборы символов для конкретных поставщиков и, в конечном итоге, Unicode стали предпочтительными методами кодирования большинства этих вариантов.

  1. ^ a b c Является подмножеством одной из международных эталонных версий ISO 646, но не включает все символы, которые присутствуют в инвариантном наборе. Включено для сравнения.
  2. ^ Также британский телетекст.
  3. ^ a b c d e f g h i j k l m n Не полностью соответствует инвариантному набору, но является тесно связанной производной ISO 646. Включено сюда для сравнения.
  4. ^ a b c d e Вариант ISO 646, идентичный варианту NRCS.
  5. ^ Также World System Teletext (DE)
  6. ^ Также телетекст мировой системы (SE / FI / HU)
  7. ^ a b Наборы символов NATS (например, NATS-SEFI [71] ) заменяют @(0x40) и `(0x60) на «Единичное пространство A» (UA) и «Единичное пространство B» (UB). Простое пространство (0x20) расширяется по ширине. UA и UB предназначены для фиксированной ширины, UA должен быть не меньше ширины UB. RFC  1345 сопоставляет UA и UB с кодовыми точками ISO 10646 (UCS) U + E002 и U + E003, обе в области частного использования , соответственно (хотя в нем также перечислены сопоставления PUA для нескольких других символов, которые теперь имеют кодовые точки UCS). Юникод содержит некоторое количество пробелов, которые могут приблизительно соответствовать.
  8. ^ Соответствие инвариантному набору ISO 646 сомнительно, но это тесно связанная производная от ISO 646. Включено сюда для сравнения.

Производные для других алфавитов [ править ]

Некоторые 7-битные наборы символов для нелатинских алфавитов получены из стандарта ISO 646: они сами по себе не составляют ISO 646 из-за несоблюдения его инвариантных кодовых точек (часто заменяющих буквы хотя бы одного регистра) из-за поддержки различных алфавиты, для которых набор национальных кодовых точек обеспечивает недостаточное пространство для кодирования. Примеры включают:

  • 7-битный туркменский (ISO-IR-230). [86]
  • 7-битный греческий.
    • В ELOT 927 (ISO-IR-088), [45] греческий алфавит отображается в алфавитном порядке (для окончательной сигмы за исключением) позиции 0x61-0x71 и 0x73-0x79, поверх букв латинского алфавита в нижнем регистре.
    • ISO-IR-018 [87] сопоставляет греческий алфавит с обоими регистрами букв, используя другую схему (не в алфавитном порядке, но пытаясь, где возможно, сопоставить греческие буквы с латинскими буквами, которые в некотором смысле соответствуют), и ISO-IR-019 [88] отображает греческий алфавит в верхнем регистре над латинскими строчными буквами, используя ту же схему, что и ISO-IR-018.
    • Нижняя половина кодировки символов символьного шрифта [89] использует свою собственную схему для сопоставления греческих букв обоих регистров с римскими буквами ASCII, также пытаясь сопоставить греческие буквы с римскими буквами, которые в некотором смысле соответствуют, но принимая разные решения в этом внимание (см. таблицу ниже). Он также заменяет неизменные кодовые точки 0x22 и 0x27 и пять национальных кодовых точек математическими символами. Хотя он не предназначен для набора греческой прозы, он иногда используется для этой цели.
    • ISO-IR-027 [46] (подробно описанный в таблице выше, а не ниже) включает латинский алфавит без изменений, но добавляет некоторые греческие заглавные буквы, которые не могут быть представлены гомоглифами латинского алфавита ; хотя он явно основан на ISO 646, некоторые из них отображаются в кодовые точки, которые инвариантны в ISO 646 (0x21, 0x3A и 0x3F), и поэтому это не настоящий вариант ISO 646.
    • Всемирная система телетекст кодирования для греческих целей еще одна схема отображения греческих букв в алфавитном порядке над ASCII буквы обоих случаях, в частности , в том числе несколько писем с диакритическими знаками. [90]
  • 7-битная кириллица
    • КОИ-7 или Короткий КОИ, используется для русского языка . Кириллические символы отображаются в позиции 0x60–0x7E, поверх латинских строчных букв, сопоставляя, где это возможно, гомологичные буквы (где отображается на w, а не на v). Заменены вариантами КОИ-8 .
    • SRPSCII и MAKSCII , кириллические варианты YUSCII (латинский вариант - YU / ISO-IR-141 в таблице выше), используемые для сербского и македонского языков соответственно. В значительной степени гомологичны латинский вариант YUSCII (после сербских digraphia правила ), за исключением Љ (LJ), Њ (Нью - Джерси), Џ (DZ) и ѕ (DZ), что соответствует орграфам в Latin-сценарии орфографии и отображается над буквами, которые не используются в сербском или македонском (q, w, x, y).
    • В наборах G0 для кодировок телетекста World System для русского / болгарского [91] и украинского [92] используются наборы G0, аналогичные KOI-7 с некоторыми изменениями. Соответствующий набор G0 для сербской кириллицы [a] [93] использует схему, основанную на кодировке телетекста для сербско-хорватского и словенского латинского алфавита , в отличие от значительно отличающегося от YUSCII.
  • 7-битный иврит, SI 960 . Еврейский алфавит отображаются на позицию 0x60-0x7A, поверх строчных букв латинского алфавита (и грависа для алеф). 7-битный иврит всегда хранился в визуальном порядке. Это отображение с установленным старшим битом, то есть с еврейскими буквами в 0xE0–0xFA, соответствует ISO 8859-8 . Кодировка телетекста World System для иврита использует те же сопоставления букв, но использует BS_Viewdata в качестве базовой кодировки (тогда как SI 960 использует US-ASCII) и включает знак шекеля в 0x7B.
  • 7-битный арабский, ASMO 449 (ISO-IR-089). [94] арабский алфавит отображается на позиции 0x41-0x5A и 0x60-0x6A, на вершине как прописные и строчные буквы латинского алфавита.

Ниже приводится сравнение некоторых из этих кодировок. Показан только один регистр, за исключением случаев, когда регистры сопоставляются с разными буквами. В таких случаях сначала отображается отображение с наименьшим кодом. Для некоторых букв даны возможные транскрипции; где это опущено, буква может считаться соответствующей римской букве, на которую она нанесена.

См. Также [ править ]

  • ISO / IEC 2022 Информационные технологии: структура кода символа и методы расширения
  • ISO / IEC 6937 (ANSI)
  • ISO / IEC JTC 1 / SC 2

Сноски [ править ]

  1. ^ a b Обозначено «Основной набор кириллицы G0 - Вариант 1 - сербский / хорватский», но включает македонские буквы Ќ и Ѓ (но не Ѕ ). Подмножество латинских букв, в основном те, которые не имеют гомоглифов в наборе G0, включены в набор G1 (15.6.7 Таблица 41), включая S / s в 0x6B / 7B. Хорватский написан латиницей .

Ссылки [ править ]

  1. ^ Mullendore, Ральф Элвин (1964) [1963]. Птак, Джон Ф. (ред.). «О раннем развитии ASCII - История ASCII» . JF Ptak Science Books (опубликовано в марте 2012 г.). Архивировано 26 мая 2016 года . Проверено 26 мая 2016 .
  2. ^ Наборы символов с 6 и 7 битами для обмена информацией (проект), Международная организация по стандартизации , июль 1964 г. (NB. 21 страница. С сопроводительным письмом для членов X3.2 и рабочих групп от Эрика Клэмона.)
  3. ^ a b c Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие . Серия системного программирования (1-е изд.). Addison-Wesley Publishing Company, Inc., стр. 7, 9, 412. ISBN 0-201-14460-3. LCCN  77-90165 . Проверено 22 мая 2016 . [1]
  4. ^ a b c d e f g Стандартный ECMA-6: набор 7-битных кодированных символов (PDF) (5-е изд.). Женева, Швейцария: Европейская ассоциация производителей компьютеров (Ecma). Март 1985. Архивировано (PDF) из оригинала 29 мая 2016 года . Проверено 29 мая 2016 . Технический комитет TC1 ECMA впервые встретился в декабре 1960 года, чтобы подготовить стандартные коды для целей ввода / вывода. [30] апреля 1965 года Стандарт ECMA-6 был принят Генеральной Ассамблеей ECMA.
  5. ^ Бодфиш, Джон; Уилсон, Марк; Грегори, Стивен; Най, Джули Блум. Бодфиш, Джон (ред.). «Инвариантная обработка символов» . Протокол обмена циркуляцией NISO . Департамент образования Колорадо, США: Постоянный комитет NCIP (NCIP-SC). Архивировано из оригинала на 2013-12-24 . Проверено 30 мая 2016 .
  6. Демченко, Юрий (2000) [1997]. «Международная стандартизация 7-битных кодов, ISO 646» . ТЕРЕНА. 4. Архивировано 17 июня 2016 года . Проверено 13 августа 2012 .
  7. ^ a b c Стандартный ECMA-6: набор 7-битных кодированных символов (PDF) (6-е изд.). Женева, Швейцария: Европейская ассоциация производителей компьютеров (Ecma). Август 1997 г. [декабрь 1991 г.]. Архивировано (PDF) из оригинала 29 мая 2016 года . Проверено 29 мая 2016 .
  8. ^ «Обработка информации - набор 7-битных кодированных символов ISO для обмена информацией» . 1983-07-01. ISO 646: 1983. Архивировано 30 мая 2016 года . Проверено 30 мая 2016 .
  9. ^ "Информационные технологии - набор 7-битных кодированных символов ISO для обмена информацией" (3-е изд.). 1991-12-16. ИСО / МЭК 646: 1991. Архивировано 30 мая 2016 года . Проверено 30 мая 2016 .
  10. ^ a b Стандартный ECMA-6: 7-битный набор кодированных символов ввода / вывода (PDF) (4-е изд.). Женева, Швейцария: Европейская ассоциация производителей компьютеров (Ecma). Август 1973 г. Архивировано (PDF) из оригинала 29 мая 2016 года . Проверено 29 мая 2016 .
  11. ^ ECMA (1991). «Набор 7-битных кодированных символов» (PDF) . ECMA-6.
  12. ^ a b Norge Standardiseringforbund (1 июня 1982 г.). Норвежский стандарт NS 4551, версия 2 (PDF) . ITSCJ / IPSJ . ISO-IR -61.
  13. ^ a b Китайская ассоциация стандартизации (1 июня 1982 г.). Набор 7-битных кодированных символов для обмена информацией (PDF) . ITSCJ / IPSJ . ISO-IR -57.
  14. ^ a b c d e f g h i j k l "15.6.2 Поднаборы латинских национальных опций, таблица 36", ETS 300 706: Спецификация расширенного телетекста (PDF) , Европейский институт стандартов электросвязи ( ETSI ), стр. 115
  15. ^ "Информация о кодовой странице SBCS - CPGID: 01020 / Название: Канадский (французский) вариант" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1992-10-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  16. ^ a b c d e f g h i j k l m n o p q r s t "HP PCL / PJL Reference PCL 5 Comparison Guide" (PDF) (2-е изд.). Компания Hewlett-Packard, LP . Июнь 2003 г. Номер детали HP 502-0378. Архивировано из оригинального (PDF) 10 августа 2016 года . Проверено 10 августа 2016 .
  17. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af ag ah ai aj ak al am an ao ap Бемер, Роберт Уильям (1980) . «Глава 1: Внутри ASCII». Программное обеспечение общего назначения (PDF) . Лучшее в эпоху интерфейсов. 2 . Портленд, Орегон, США: dilithium Press. С. 1–50. ISBN 0-918398-37-1. LCCN  79-67462 . Архивировано из оригинала на 2016-08-27 . Проверено 27 августа 2016 ,от: Бемер, Роберт Уильям (май 1978 г.). «Внутри ASCII - Часть I». Возраст интерфейса . Портленд, Орегон, США: dilithium Press. 3 (5): 96–102., Бемер, Роберт Уильям (июнь 1978 г.). «Внутри ASCII - Часть II». Возраст интерфейса . Портленд, Орегон, США: dilithium Press. 3 (6): 64–74., Бемер, Роберт Уильям (июль 1978 г.). «Внутри ASCII - Часть III». Возраст интерфейса . Портленд, Орегон, США: dilithium Press. 3 (7): 80–87.
  18. ^ a b Комиссия по стандартизации Сверигеса (1975). Основной графический набор символов NATS для передачи газетного текста в Дании и Норвегии (PDF) . ITSCJ / IPSJ . ISO-IR -9-1.
  19. ^ "Информация о кодовой странице SBCS - CPGID: 01011 / Имя: 7-Bit Germany FR" Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1987-08-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  20. ^ a b c d e "Идентификаторы кодовой страницы" . Сеть разработчиков Microsoft . Microsoft . 2014. Архивировано 19 июня 2016 года . Проверено 19 июня 2016 .
  21. ^ a b c d e "Веб-кодировки - Internet Explorer - Кодировки" . WHATWG Wiki . 2012-10-23. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  22. ^ Фоллер, Антонин (2014) [2011]. «Немецкая (IA5) кодировка - кодировки Windows» . WUtils.com - онлайн-утилита и справка . Программное обеспечение Motobit. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  23. ^ Датский стандарт DS 2089: Применение 7-битного набора символов ISO . Февраль 1974 г. УДК 681.3: 003.62.
  24. ^ Страуструп, Бьярне (1994-03-29). Дизайн и эволюция C ++ (1-е изд.). Издательство Эддисон-Уэсли . ISBN 0-201-54330-3.
  25. ^ "Информация о кодовой странице SBCS - CPGID: 01017 / Название: 7-битная Дания" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1987-08-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  26. ^ "Информация о кодовой странице SBCS - CPGID: 01023 / Название: Вариант для Испании" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1992-10-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  27. ^ "Информация о кодовой странице SBCS - CPGID: 01014 / Название: 7-битная Испания" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1987-10-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  28. ^ a b «Информация о кодовой странице SBCS - CPGID: 01018 / Название: 7-Bit Финляндия / Швеция» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1987-08-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  29. ^ "Информация о кодовой странице SBCS - CPGID: 01010 / Название: 7-Bit France" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1987-08-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  30. ^ "Информация о кодовой странице SBCS - CPGID: 01104 / Название: Французский набор NRC" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1987-08-01. Архивировано 21 июня 2016 года . Проверено 21 июня 2016 .
  31. ^ "Информация о кодовой странице SBCS - CPGID: 01013 / Название: 7-битное Соединенное Королевство" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1987-08-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  32. ^ a b ISO / TC 97 / SC 2 (1975). Графический набор символов международной справочной версии ISO 646 (PDF) . ITSCJ / IPSJ . ISO-IR -2.
  33. ^ «Информация о кодовой странице SBCS - CPGID: 01009 / Имя: ISO IRV» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1990-04-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  34. ^ Фоллер, Антонин (2014) [2011]. «Западноевропейская (IA5) кодировка - кодировки Windows» . WUtils.com - онлайн-утилита и справка . Программное обеспечение Motobit. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  35. ^ "Информация о кодовой странице SBCS - CPGID: 01012 / Название: 7-битная Италия" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1987-08-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  36. ^ "Информация о кодовой странице SBCS - CPGID: 00895 / Название: Япония, 7-битная латиница" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1986-10-01. Архивировано 18 июня 2016 года . Проверено 18 июня 2016 .
  37. ^ "Информация о кодовой странице SBCS - CPGID: 01019 / Название: 7-Bit Нидерланды" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1987-08-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  38. ^ "Информация о кодовой странице SBCS - CPGID: 01016 / Название: 7-битная Норвегия" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1987-08-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  39. ^ Фоллер, Антонин (2014) [2011]. «Норвежская (IA5) кодировка - кодировки Windows» . WUtils.com - онлайн-утилита и справка . Программное обеспечение Motobit. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  40. ^ "Информация о кодовой странице SBCS - CPGID: 01015 / Название: 7-Bit Portugal" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1987-08-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  41. ^ Фоллер, Антонин (2014) [2011]. «Шведская (IA5) кодировка - кодировки Windows» . WUtils.com - онлайн-утилита и справка . Программное обеспечение Motobit. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  42. ^ "Информация о кодовой странице SBCS - CPGID: 00367 / Имя: ASCII" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1978-01-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  43. ^ Фоллер, Антонин (2014) [2011]. «Кодировка US-ASCII - кодировки Windows» . WUtils.com - онлайн-утилита и справка . Программное обеспечение Motobit. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  44. ^ а б BSI (1981-06-01). Буквенно-цифровые символы для просмотра данных и широковещательного телетекста (PDF) . ITSCJ / IPSJ . ISO-IR -47.
  45. ^ а б ЭЛОТ (1984-07-01). Греческий набор символов для греческого языка (PDF) . ITSCJ / IPSJ . ISO-IR -88.
  46. ^ а б в ECMA (1976). Латинско-греческий смешанный графический набор (только заглавные греческие буквы) (PDF) . ITSCJ / IPSJ . ISO-IR -27.
  47. ^ "Информация о кодовой странице SBCS - CPGID: 01021 / Название: Вариант для Швейцарии" . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. IBM . 1992-10-01. Архивировано 17 июня 2016 года . Проверено 17 июня 2016 .
  48. ^ Sveriges standardiseringskommission (1975). Комплект NATS Control для передачи газетного текста (PDF) . ITSCJ / IPSJ . ISO-IR -7.
  49. ^ ANSI (1975). Набор графических символов ASCII (PDF) . ITSCJ / IPSJ . ISO-IR -6.
  50. ^ IBM (1990). «Кодовая страница 01009» (PDF) . РЕГИСТРАЦИЯ: Наборы графических символов и кодовые страницы .
  51. ^ Dansk Standardiseringsråd (1993-01-21). Базовый набор символов ISO / IEC 646 (PDF) . ITSCJ / IPSJ . ISO-IR -170.
  52. ^ "15.6.1 Latin G0 Set", ETS 300 706: Спецификация расширенного телетекста (PDF) , Европейский институт стандартов электросвязи ( ETSI ), стр. 114
  53. ^ Международное агентство по атомной энергии (1981-07-15). Подмножество ISO 646 для INIS (PDF) . ITSCJ / IPSJ . ISO-IR -49.
  54. ^ Международный союз электросвязи (1985-08-01). Основной набор графических символов Teletex (PDF) . ITSCJ / IPSJ . ISO-IR -102.
  55. ^ Японский комитет промышленных стандартов (1975). Японский римский графический набор символов (PDF) . ITSCJ / IPSJ . ISO-IR -14.
  56. ^ ISO / TC 97 / SC 2 (1985-08-01). Базовый набор графических символов японского языка OCR-B (PDF) . ITSCJ / IPSJ . ISO-IR -92.
  57. ^ a b Лунде, Кен (2008). «3. Стандарты набора символов (§ CJKV-Roman)». CJKV Обработка информации (2-е изд.). O'Reilly Media . С. 91–92. ISBN 9780596514471.
  58. ^ BSI (1975-12-01). Набор графических символов 7-битного кода данных Соединенного Королевства (PDF) . ITSCJ / IPSJ . ISO-IR -4.
  59. ^ IBM (1992). «Кодовая страница 01101» (PDF) . РЕГИСТРАЦИЯ: Наборы графических символов и кодовые страницы .
  60. ^ NSAI (1999-12-07). Вариант 7-битного набора символов ISO для ирландского гэльского языка (PDF) . ITSCJ / IPSJ . ISO-IR -207.
  61. ^ AFNOR (1983-06-01). Jeu de caractères graphiques français pour la langue français (PDF) . ITSCJ / IPSJ . ISO-IR -69.
  62. ^ AFNOR (1975). Французский набор графических символов для французского языка (PDF) . ITSCJ / IPSJ . ISO-IR -25.
  63. ^ Совет по стандартам Канады (1986-02-01). Альтернативный основной графический набор № 1 (PDF) . ITSCJ / IPSJ . ИСО-ИК- 121.
  64. ^ Совет по стандартам Канады (1986-02-01). Альтернативный основной графический набор № 2 (PDF) . ITSCJ / IPSJ . ISO-IR -122.
  65. ^ IBM (1992). «Кодовая страница 01021» (PDF) . РЕГИСТРАЦИЯ: Наборы графических символов и кодовые страницы .
  66. ^ DIN (1975). Немецкая эталонная версия набора 7-битных кодированных символов ISO (только графика) для немецкого языка, как определено в немецком стандарте DIN 66 003 – июнь 1974 г. (PDF) . ITSCJ / IPSJ . ISO-IR -21.
  67. ^ Sveriges Standardiseringskommission (1975). Шведский основной графический набор символов (PDF) . ITSCJ / IPSJ . ISO-IR -10.
  68. ^ Sveriges Standardiseringskommission (1975). Шведский графический набор символов для официального написания имен (PDF) . ITSCJ / IPSJ . ISO-IR -11.
  69. ^ IBM (1992). «Кодовая страница 01106» (PDF) . РЕЕСТР: Наборы графических символов и кодовые страницы .
  70. ^ IBM (1992). «Кодовая страница 01103» (PDF) . РЕЕСТР: Наборы графических символов и кодовые страницы .
  71. ^ a b Sveriges Standardiseringskommission (1975). Основной графический набор символов NATS для передачи газетного текста в Финляндии и Швеции (PDF) . ITSCJ / IPSJ . ISO-IR -8-1.
  72. ^ IBM (1987). «Кодовая страница 01017» (PDF) . РЕГИСТРАЦИЯ: Наборы графических символов и кодовые страницы .
  73. ^ IBM (1992). «Кодовая страница 01105» (PDF) . РЕГИСТРАЦИЯ: Наборы графических символов и кодовые страницы .
  74. ^ IBM (1992). «Кодовая страница 01107» (PDF) . РЕГИСТРАЦИЯ: Наборы графических символов и кодовые страницы .
  75. ^ Norge Standardiseringforbund (1982-06-01). Норвежский стандарт NS 4551 - Версия 1 (PDF) . ITSCJ / IPSJ . ISO-IR -60.
  76. ^ ECMA (1976). Вариант набора 7-битных кодированных символов ISO (только графика) для испанского языка (PDF) . ITSCJ / IPSJ . ISO-IR -17.
  77. ^ ECMA (1984-07-01). Набор графических символов для испанского языка (PDF) . ITSCJ / IPSJ . ISO-IR -85.
  78. ^ Rad pro normalizaci a měřeni (1989-07-01). Набор графических символов Республики Куба (PDF) . ITSCJ / IPSJ . ISO-IR -151.
  79. ^ ECMA (1976-12-30). Набор графических символов для португальского языка (PDF) . ITSCJ / IPSJ . ISO-IR -16.
  80. ^ ECMA (1984-07-01). Набор графических символов для португальского языка (PDF) . ITSCJ / IPSJ . ISO-IR -84.
  81. ^ Федеральное учреждение по стандартизации (1987-11-01). Сербско-хорватский и словенский латинский алфавит (PDF) . ITSCJ / IPSJ . ISO-IR -141.
  82. ^ IBM (1987). «Кодовая страница 01019» (PDF) . РЕГИСТРАЦИЯ: Наборы графических символов и кодовые страницы .
  83. ^ IBM (1992). «Кодовая страница 01102» (PDF) . РЕГИСТРАЦИЯ: Наборы графических символов и кодовые страницы .
  84. ^ ECMA (1976). Вариант 7-битного набора символов ISO (только графика) для итальянского языка (PDF) . ITSCJ / IPSJ . ISO-IR -15.
  85. ^ Венгерское бюро по стандартизации (1984-07-01). Венгерская справочная версия ISO 646 (HRV) (PDF) . ITSCJ / IPSJ . ISO-IR -86.
  86. ^ Туркменстандартлары (2000-09-14). Туркменский алфавит (PDF) . ITSCJ / IPSJ . ISO-IR -230.
  87. ^ а б ECMA (1976). Греческий графический набор (PDF) . ITSCJ / IPSJ . ISO-IR -18.
  88. ^ ECMA (1976). Латино-греческий комбинированный графический набор (только заглавные буквы) (PDF) . ITSCJ / IPSJ . ISO-IR -19.
  89. ^ «Сопоставить (внешняя версия) от набора символов Mac OS Symbol к Unicode 4.0 и более поздним версиям» .
  90. ^ «15.6.8: Греческий набор G0», ETS 300 706: Спецификация расширенного телетекста (PDF) , Европейский институт стандартов электросвязи ( ETSI ), стр. 121
  91. ^ «15.6.5: Набор кириллицы G0 - Вариант 2 - Русский / Болгарский», ETS 300 706: Спецификация расширенного телетекста (PDF) , Европейский институт стандартов электросвязи ( ETSI ), стр. 118
  92. ^ «15.6.6: Набор кириллицы G0 - Вариант 3 - Украинский», ETS 300 706: Спецификация расширенного телетекста (PDF) , Европейский институт стандартов электросвязи ( ETSI ), стр. 119
  93. ^ «15.6.4: Набор кириллицы G0 - Вариант 1 - Сербский / Хорватский», ETS 300 706: Спецификация расширенного телетекста (PDF) , Европейский институт телекоммуникационных стандартов ( ETSI ), стр. 117
  94. ^ ASMO (1985-01-01). Набор 7-битных арабских символов для обмена информацией (PDF) . ITSCJ / IPSJ . ISO-IR -89.

Дальнейшее чтение [ править ]

  • Фишер, Эрик, изд. (1975) [1972]. Исходные документы по истории кодов символов 1972–1975 гг. (Сборник) . Источник 2020-06-07 [2] (79 страниц), в том числе: Бемер, Роберт Уильям (1972). «взгляд на историю набора символов ISO». Компьютерный журнал Honeywell . Феникс, Аризона, США: Honeywell Information Systems. 6 (4): 274–286, 287–291. (13 + 5 страниц) и многие другие документы и переписка.

Внешние ссылки [ править ]

  • Zeichensatz nach ISO 646 (ASCII) (на немецком языке)
  • История на сайте GNU Aspell
  • Таблицы символов ISO646 Таблицы символов от Коичи Ясуока (安岡 孝) (см. Внутренние таблицы символов ISO646 и таблицы символов квази-ISO646 )
  • Turkish Text Deasciifier инструмент (основанный на статистическом анализе пентаграммы турецкого языка), который возвращает турецкий текст с ASCII-кодировкой, определяя соответствующие (но неоднозначные) диакритические знаки, которые обычно необходимы в турецком языке, но отсутствуют в наборе US-ASCII.