Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Ранняя фортепианная клавиатура Бодо

Код Бодо ([bodo] ) - это ранняя кодировка символов для телеграфии, изобретенная Эмилем Бодо в 1870-х годах. [1] Это был предшественник Международного телеграфного алфавита № 2 (ITA2), наиболее распространенногокода телетайпа, который использовался до появления ASCII . Каждый символ в алфавите представлен серией из пяти битов , передаваемых по каналу связи, например по телеграфному проводу или радиосигналу. Скорость передачи символов измерение известно как бод , и происходит от того же самого названия.

История [ править ]

Код Бодо (ITA1) [ править ]

В таблице ниже столбцы I, II, III, IV и V показывают код; Пусть. и в столбцах на рис. показаны буквы и цифры для версий Continental и UK; а ключи сортировки представляют таблицу в следующем порядке: по алфавиту, серый и британский.

Бодо разработал свой первый мультиплексный телеграф в 1872 году [2] [3] и запатентовал его в 1874 году. [3] [4] В 1876 году он перешел с шестибитного кода на пятибитовый [3], как было предложено Карл Фридрих Гаусс и Вильгельм Вебер в 1834 г. [2] [5] с равными интервалами включения и выключения, что позволило передавать латинский алфавит и включало знаки препинания и контрольные сигналы. Сам код не был запатентован (только машина), потому что французское патентное право не позволяет патентовать концепции. [6]

5-битный код Бодо был адаптирован для отправки с ручной клавиатуры, и никогда не было сконструировано телепринтерное оборудование, которое использовало бы его в исходной форме. [7] Код вводился на клавиатуре, на которой было всего пять клавиш типа фортепиано, и для управления ею использовались два пальца левой руки и три пальца правой руки. После нажатия клавиши они блокировались до тех пор, пока механические контакты в распределительном устройстве не прошли через сектор, подключенный к этой конкретной клавиатуре, когда клавиатура была разблокирована для ввода следующего символа со звуковым щелчком (известным как "сигнал каденции"), чтобы предупредить оператора. Операторам приходилось поддерживать постоянный ритм, а обычная скорость работы составляла 30 слов в минуту. [8]

В таблице "показано присвоение кода Бодо, который использовался в почтовом отделении Великобритании для континентальных и внутренних перевозок. Ряд знаков континентального кода заменены дробными числами во внутреннем коде. Передаются элементы кода 1, 2 и 3. клавишами 1, 2 и 3, и ими управляют первые три пальца правой руки. Элементы кода 4 и 5 передаются клавишами 4 и 5, и ими управляют первые два пальца левой руки ». [7] [9] [10]

Код Бодо стал известен как Международный телеграфный алфавит № 1 ( ITA1 ). Больше не используется.

Код Мюррея [ править ]

Бумажная лента с отверстиями, символизирующая «Код Бодо – Мюррея». Обратите внимание на полностью заштрихованные столбцы кодов «Удалить / Выбрать буквы» в начале сообщения (справа); использовались, чтобы легко перерезать полосу между отдельными сообщениями. Затем сообщение начинается с элемента управления сдвигом цифры, за которым следует возврат каретки.

В 1901 году код Бодо был изменен Дональдом Мюрреем (1865–1945), что было вызвано его разработкой клавиатуры, похожей на пишущую машинку. В системе Мюррея использовался промежуточный этап; перфоратор для клавиатуры, позволяющий оператору пробивать бумажную ленту, и ленточный передатчик для отправки сообщения с перфоленты . На приемном конце линии механизм печати будет печатать на бумажной ленте, и / или реперфоратор может использоваться для изготовления перфорированной копии сообщения. [11]Поскольку больше не существовало связи между движением руки оператора и передаваемыми битами, не было проблем с компоновкой кода, чтобы минимизировать утомляемость оператора, и вместо этого Мюррей разработал код, чтобы минимизировать износ оборудования, назначив кодовые комбинации с наименьшим количеством пробиты дырки в наиболее часто используемых символах . [12] [13]

Например, буквы с одним отверстием - это E и T. Десять букв с двумя отверстиями - это AOINSHRDLZ, что очень похоже на порядок « Etaoin shrdlu », используемый в машинах Linotype . Еще десять букв, BCGFJMPUWY, имеют по три отверстия каждая, а буквы с четырьмя отверстиями - VXKQ.

Код Мюррея также представил так называемые «эффекторы формата» или « управляющие символы » - коды CR (возврат каретки) и LF (перевод строки). Некоторые коды Бодо переместились на позиции, на которых они оставались с тех пор: NULL или BLANK и код DEL. NULL / BLANK использовался как код ожидания, когда сообщения не отправлялись, но тот же код использовался для кодирования разделения пробелов между словами. Последовательности кодов DEL (полностью перфорированные столбцы) использовались в начале или в конце сообщений или между ними, что позволяло легко разделять отдельные сообщения. (Коды BELL могут быть вставлены в эти последовательности, чтобы сигнализировать удаленному оператору о поступлении нового сообщения или о том, что передача сообщения прекращена).

Ранние машины British Creed также использовали систему Мюррея.

Western Union [ править ]

Клавиатура телетайпа с использованием кода Бодо (вариант для США), с клавишами переключения FIGS и LTRS

Код Мюррея был принят Western Union, который использовал его до 1950-х годов, с некоторыми изменениями, которые заключались в опускании некоторых символов и добавлении большего количества управляющих кодов. Был введен явный символ SPC (пробел) вместо BLANK / NULL, а новый код BEL вызвал звонок или иным образом произвел звуковой сигнал на приемнике. Дополнительно WRU или "Кто ты?" был введен код, который заставлял принимающую машину отправлять идентификационный поток обратно отправителю.

ITA2 [ править ]

В 1924 году CCITT представил код Международного телеграфного алфавита № 2 ( ITA2 ) [14] в качестве международного стандарта, который был основан на коде Western Union с некоторыми незначительными изменениями. В США стандартизована версия ITA2, названная американским кодом телетайпа (US TTY), который был основой для 5-битных кодов телетайпа до появления 7-битного кода ASCII в 1963 году [15].

Некоторые кодовые точки (отмечены синим цветом в таблице) зарезервированы для использования в конкретных странах. [16]

Позиция кода, присвоенная Null, фактически использовалась только для состояния простоя телетайпов. Во время длительных периодов простоя частота импульсов не была синхронизирована между обоими устройствами (которые могли даже быть выключены или постоянно не соединены между собой на коммутируемых телефонных линиях). Чтобы начать сообщение, сначала необходимо было откалибровать частоту импульсов, последовательность регулярно синхронизированных «меточных» импульсов (1), с помощью группы из пяти импульсов, которые также могли быть обнаружены простыми пассивными электронными устройствами для включения телетайпа. Эта последовательность импульсов генерировала серию символов стирания / удаления, а также инициализировала состояние приемника в режиме сдвига букв. Однако первый импульс может быть потерян, поэтому эта процедура включения может быть затем завершена одним пустым значением, сразу за которым следует символ стирания / удаления. Чтобы сохранить синхронизацию между устройствами, нулевой код нельзя было использовать произвольно в середине сообщений (это было улучшением исходной системы Бодо, где пробелы не были явно дифференцированы, поэтому было трудно поддерживать счетчики импульсов для повторения пробелов в телепринтеры). Но тогда можно было повторно синхронизировать устройства в любое время, отправив Null в середине сообщения (сразу за которым следует элемент управления Erasure / Delete / LS, если за ним следует буква, или элемент управления FS, если за ним следует цифра). Отправка нулевых элементов управления также не приводила к переходу бумажной ленты к следующему ряду (так как ничего не было пробито), поэтому это позволяло сэкономить драгоценную длину перфорированной бумажной ленты. С другой стороны, управляющий код стирания / удаления / LS всегда перфорировался и всегда переводился в режим (начальных) букв. По некоторым данным,[16]

Код Shift to Letters (LS) также можно использовать как способ отмены / удаления текста с перфоленты после того, как он был прочитан, что позволяет безопасно уничтожить сообщение перед удалением перфоленты. [ требуется разъяснение ]Функционально он также может играть ту же роль-заполнитель, что и код удаления в ASCII (или других 7-битных и 8-битных кодировках, включая EBCDIC для перфокарт). После того, как коды во фрагменте текста были заменены произвольным количеством кодов LS, все последующее все еще сохраняется и декодируется. Его также можно использовать в качестве инициатора, чтобы убедиться, что декодирование первого кода не даст цифры или другого символа со страницы с рисунками (поскольку нулевой код может быть произвольно вставлен в конце или начале полосы перфорации, и следует игнорировать, тогда как пробел имеет значение в тексте).

Ячейки, отмеченные как зарезервированные для расширений (которые снова используют код LS во второй раз - сразу после первого кода LS - для перехода со страницы цифр на страницу сдвига букв), были определены для перехода в новый режим. В этом новом режиме страница букв содержит только строчные буквы, но сохраняет доступ к третьей кодовой странице для прописных букв, либо путем кодирования одной буквы (путем отправки LS перед этой буквой), либо блокировки (с помощью FS + LS) для неограниченное количество заглавных букв или цифр перед разблокировкой (с одним LS) для возврата в строчный режим. [18] Ячейка, помеченная как «Зарезервировано», также может использоваться (с использованием кода FS со страницы сдвига цифр) для переключения страницы цифр (которая обычно содержит цифры и национальные строчные буквы или символы) на четвертую страницу (где национальные буквы являются прописными, а другие символы могут быть закодированы).

ITA2 до сих пор используется в телекоммуникационных устройствах для глухих (TDD), телексах и некоторых радиолюбительских приложениях, таких как радиотелетайп (RTTY). ITA2 также используется в Enhanced Broadcast Solution, финансовом протоколе начала 21-го века, разработанном Deutsche Börse , для уменьшения объема кодирования символов. [19]

Номенклатура [ править ]

Почти все телетайпное оборудование 20-го века использовало код Western Union, ITA2, или его варианты. Радиолюбители случайно называют ITA2 и варианты "Бодо" неправильно, [20] и даже Справочник любительского радио Американской лиги радиорелейной связи делает это, хотя в более поздних изданиях таблицы кодов правильно идентифицируют его как ITA2.

Набор символов [ править ]

Значения, показанные в каждой ячейке, представляют собой кодовые точки Unicode , данные для сравнения.

Оригинальные варианты Бодо [ править ]

Оригинал Бодо, внутренний рынок Великобритании [ править ]

  Письмо  Число  Пунктуация  Символ  Другой  Ведущий байт  Неопределенный

Оригинальный Бодо, континентальный европейский [ править ]

  Письмо  Число  Пунктуация  Символ  Другой  Ведущий байт  Неопределенный

Оригинал Бодо, Италия 1 [ править ]

  Письмо  Число  Пунктуация  Символ  Другой  Ведущий байт  Неопределенный

Варианты Бодо – Мюррея [ править ]

Код Мюррея [ править ]

  Письмо  Число  Пунктуация  Символ  Другой  Ведущий байт  Неопределенный

ITA 2 и US-TTY [ править ]

  Письмо  Число  Пунктуация  Символ  Другой  Ведущий байт  Неопределенный

Код погоды [ править ]

Метеорологи использовали вариант ITA2 с символами цифр и регистров, за исключением десяти цифр, BEL и нескольких других символов, замененных символами погоды:

Кодировка погодного телетайпа

  Письмо  Число  Пунктуация  Символ  Другой  Ведущий байт  Неопределенный

Подробности [ править ]

Примечание. В этой таблице предполагается, что пробел, названный «1» Бодо и Мюрреем, является крайним правым и наименее значимым. Способ упаковки передаваемых битов в более крупные коды варьировался в зависимости от производителя. Наиболее распространенное решение распределяет биты от младшего бита к старшему (оставляя три старших бита байта неиспользованными).

Таблица кодов ITA2 (выраженных шестнадцатеричными числами)

В ITA2 символы выражаются с помощью пяти битов. ITA2 использует два поднабора кода, «сдвиг букв» (LTRS) и «сдвиг цифр» (фиг.). Символ (11011) FIGS сигнализирует о том, что следующие символы должны интерпретироваться как присутствующие в наборе FIGS, пока они не будут сброшены символом LTRS (11111). При использовании клавиша переключения LTRS или FIGS нажимается и отпускается, передавая соответствующий символ переключения на другую машину. Затем набираются желаемые буквы или цифры. В отличие от пишущей машинки или современной компьютерной клавиатуры, клавиша Shift не удерживается нажатой, пока набираются соответствующие символы. «Запрос» вызовет ответ от другой машины. Это означает "Кто ты?"

CR - возврат каретки , LF - перевод строки , BEL - это символ колокольчика, который звонил в маленький звонок (часто используется для предупреждения операторов о входящем сообщении), SP - это пробел, а NUL - нулевой символ (пустая лента).

Примечание: двоичные преобразования кодовых точек часто отображаются в обратном порядке, в зависимости от (предположительно), с какой стороны смотреть на бумажную ленту. Отметим далее, что «контрольные» символы были выбраны таким образом, чтобы они были либо симметричными, либо полезными парами, так что вставка ленты «вверх ногами» не приводила к проблемам для оборудования, и полученная распечатка могла быть расшифрована. Таким образом, FIGS (11011), LTRS (11111) и пробел (00100) инвариантны, в то время как CR (00010) и LF (01000), обычно используемые в паре, обрабатываются одинаково независимо от порядка по страницам принтеров. [22] LTRS также можно использовать для удаления символов с бумажной ленты с перерезанием (как DEL в 7-битном ASCII ).

Последовательность RYRYRY ... часто используется в тестовых сообщениях и в начале каждой передачи. Поскольку R равно 01010, а Y равно 10101, последовательность задействует большую часть механических компонентов телетайпа при максимальной нагрузке. Также в свое время тонкая настройка приемника производилась с помощью двух цветных огней (по одному на каждый тон). «RYRYRY ...» произвел 0101010101 ..., который заставлял огни светиться с одинаковой яркостью при правильной настройке. Эта последовательность настройки полезна только тогда, когда ITA2 используется с двухтональной модуляцией FSK , такой как обычно используется при использовании радиотелетайпа (RTTY).

Реализации кода Бодо в США могут отличаться добавлением нескольких символов, таких как #, & на уровне FIGS.

В русской версии кода Бодо ( МТК-2 ) использовались три режима смены; режим кириллицы был активирован символом (00000). Из-за большего количества символов в кириллице символы ! , & , £ были опущены и заменены кириллицей, а BEL имеет тот же код, что и кириллическая буква Ю. Кириллические буквы Ъ и Ё опускаются, а Ч объединяется с цифрой 4.

См. Также [ править ]

  • Асинхронная последовательная связь
  • Шифр Бэкона - 5-битное двоичное кодирование английского алфавита, разработанное Фрэнсисом Бэконом в 1605 году. [23]
  • Список наборов символов информационной системы
  • азбука Морзе
  • Знаки для кода Морзе
  • Последовательная связь

Заметки [ править ]

  1. ^ a b c d «В распоряжении каждой администрации для ее внутренней службы» [21]
  2. ^ a b "[G] позволяет невидимое исправление на принтере страницы и *на принтерах листовки ." [21]

Ссылки [ править ]

  1. ^ Ральстон, Энтони; Рейли, Эдвин Д., ред. (1993), «Код Бодо», Энциклопедия компьютерных наук (третье изд.), Нью-Йорк: IEEE Press / Van Nostrand Reinhold, ISBN 0-442-27679-6
  2. ^ a b Х. А. Эммонс (1 мая 1916 г.). «Системы печати» . Проводная и радиосвязь . 34 : 209.
  3. ^ a b c Фишер, Эрик Н. (20 июня 2000 г.). «Эволюция кодов символов, 1874–1968» . ark: / 13960 / t07x23w8s . Проверено 20 декабря 2020 . […] В 1872 году [Бодо] начал исследования в области телеграфной системы, которая позволила бы нескольким операторам одновременно передавать данные по одному проводу и по мере получения сообщений печатать их обычными буквенными символами на полосе бумаги. Он получил патент на такую ​​систему 17 июня 1874 года. […] Вместо переменной задержки, за которой следует единичный импульс, система Бодо использовала единообразные шесть единиц времени для передачи каждого символа. […] Его ранний телеграф, вероятно, использовал шестизначный код […], который он приписывает Дэвив статье 1877 года. […] В 1876 году Бодо переработал свое оборудование, чтобы использовать пятизначный код. Тем не менее, знаки препинания и цифры все же иногда были необходимы, поэтому он перенял у Хьюза использование двух специальных буквенных и цифровых символов, которые заставляли бы принтер переключаться между регистрами в то же время, когда он продвигал бумагу без печати. Код из пяти единиц, который он начал использовать в то время […], был структурирован в соответствии с его клавиатурой […], которая управляла двумя единицами каждого символа с переключателями, управляемыми левой рукой, а остальные три единицы - правой рукой. […] [1] [2]
  4. ^ Бодо, Жан-Морис-Эмиль (июнь 1874). «Système de télégraphie rapide» (на французском языке). Архивный национальный институт промышленной собственности (INPI). Патентный Бревет 103898. Архивировано из оригинала 16 декабря 2017 года.
  5. ^ Уильям В. Vansize (25 января 1901). "Новый телеграф страничной печати" . Сделки . Американский институт инженеров-электриков. 18 : 22.
  6. ^ Procès d'Амьен Бодо против Mimault
  7. ^ a b Дженнингс 2004
  8. Перейти ↑ Beauchamp, KG (2001). История телеграфии: технология и применение . Институт инженерии и технологий . С. 394–395. ISBN 0-85296-792-6.
  9. ^ Алан Г. Хоббс, 5 кодов единиц , раздел Мультиплексная система Бодо
  10. ^ Глейк, Джеймс (2011). Информация: история, теория, потоп . Лондон: Четвертое сословие. п. 203. ISBN. 978-0-00-742311-8.
  11. Фостер, Максимилиан (август 1901 г.). «Успешный печатный телеграф» . Мировая работа: история нашего времени . II : 1195–1199 . Проверено 9 июля 2009 года .
  12. Перейти ↑ Copeland 2006 , p. 38
  13. ^ Телеграф и телефонный век . 1921. Я назначил наиболее часто используемые буквы в английском языке сигналам, представленным наименьшим количеством отверстий в перфорированной ленте, и так далее пропорционально.
  14. ^ "BruXy: Радиотелетайп связи" . 10 октября 2005 . Дата обращения 9 мая 2016 . Переданный код использует международный телеграфный алфавит № 2 (ITA-2), который был введен CCITT в 1924 году.
  15. ^ Смит, Гил (2001). «Коды телетайпов связи» (PDF) . Baudot.net. Архивировано 20 августа 2008 года (PDF) . Проверено 11 июля 2008 года .
  16. ^ a b Steinbuch, Карл В .; Вебер, Вольфганг, ред. (1974) [1967]. Taschenbuch der Informatik - Band III - Anwendungen und spezielle Systeme der Nachrichtenverarbeitung . Taschenbuch der Nachrichtenverarbeitung (на немецком языке). 3 (3-е изд.). Берлин, Германия: Springer Verlag . С. 328–329. ISBN 3-540-06242-4. LCCN  73-80607 .
  17. ^ dataIP Limited. «Кодекс Бодо» . Проверено 16 июля 2017 года .
  18. ^ Рекомендация ITU-T S.2 / 11/1988 , опубликованная в сборнике VII.1 Синей книги
  19. ^ «Расширенное решение для широковещательной передачи - Окончательная версия спецификации интерфейса» (PDF) . Deutsche Börse. 17 мая 2010 . Проверено 10 августа 2011 года .
  20. ^ Гиллам, Ричард (2002). Демистификация Unicode . Эддисон-Уэсли. п. 30. ISBN 0-201-70052-2.
  21. ^ a b c d e f g h i "Пятизначные коды" . Музей НАДКОММ. Архивировано из оригинала 4 ноября 1999 года . Проверено 5 декабря 2001 года .
  22. Дженнингс, Том (20 апреля 2016 г.). «Аннотированная история некоторых кодов символов: ITA2» . Проверено 20 января 2018 года . […] Символы, относящиеся к «управлению передачей» […], побитово симметричны - коды для FIGS, LTRS, пробел и BLANK - те же самые, перевернутые слева направо! Кроме того, коды для CR и LF равны друг другу при перестановке слева направо!
  23. ^ Бэкон, Фрэнсис (1605). Мастерство и продвижение обучения божественному и гуманному .

Дальнейшее чтение [ править ]

  • Коупленд, Б. Джек , изд. (2006). Колосс: Секреты компьютеров для взлома кода Блетчли-Парка . Оксфорд: Издательство Оксфордского университета. ISBN 978-0-19-284055-4.
  • Хоббс, Алан Г. «Документы и записи NADCOMM: пятизначные коды» . Проверено 10 февраля +2017 .
  • Дженнингс, Том (2016). «Аннотированная история некоторых кодов символов: код Бодо» . Проверено 20 января 2018 года .
  • Таблица кодов МТК-2
  • Бодо, Мюррей, ITA2, ITA5 и др.
  • "Жан-Морис-Эмиль Бодо" . Архивировано из оригинального 13 сентября 2009 года.
  • Онлайн-конвертер кода Бодо (включая просмотр на бумажной ленте)
  • Нарушение патента на первое устройство Бодо