Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Байт представляет собой блок цифровой информации , которая обычно состоит из восьми бит . Исторически байт представлял собой количество битов, используемых для кодирования одного символа текста в компьютере [1] [2], и по этой причине это наименьшая адресуемая единица памяти во многих компьютерных архитектурах . Чтобы устранить неоднозначность байтов произвольного размера из общего 8-битного определения, документы сетевого протокола, такие как Интернет-протокол (RFC 791) (1981), называют 8-битный байт октетом. [3]Эти биты в октете обычно подсчитываются с нумерацией от 0 до 7 или от 7 до 0 в зависимости от порядка байтов . Первый бит - это номер 0, что делает восьмой бит номером 7.

Размер байта исторически зависел от оборудования, и не существовало определенных стандартов, определяющих этот размер. Были использованы размеры от 1 до 48 бит. [4] [5] [6] [7] шесть-битный код символа был часто используемое внедрение в ранних системах кодирования и компьютерах с помощью шесть бит и девять-битных байты были распространены в 1960 - х годах. Эти системы часто имели слова памяти из 12, 18, 24, 30, 36, 48 или 60 бит, соответствующие 2, 3, 4, 5, 6, 8 или 10 шестибитным байтам. В эту эпоху группы битов в потоке команд часто назывались слогами [a] или slab , прежде чем термин байт стал общепринятым.

Современный стандарт де-факто восьми битов, как описано в ISO / IEC 2382-1: 1993, представляет собой удобную степень двойки, разрешающую двоично-закодированные значения от 0 до 255 для одного байта - 2 в степени 8 равно 256. [8 ] Международный стандарт IEC 80000-13 кодифицировал это общее значение. Многие типы приложений используют информацию, представленную в восьми или меньшем количестве битов, и разработчики процессоров оптимизируют это общее использование. Популярность основных коммерческих вычислительных архитектур способствовала повсеместному принятию 8-битного байта. [9] Современные архитектуры обычно используют 32- или 64-битные слова, состоящие из четырех или восьми байтов.

Символ единицы для байта был обозначен как заглавная буква B Международной электротехнической комиссией (IEC) и Институтом инженеров по электротехнике и радиоэлектронике (IEEE). [10] В международном масштабе единичный октет , символ o, явно определяет последовательность из восьми битов, устраняя двусмысленность байта. [11] [12]

История [ править ]

Термин байт был введен Вернером Бухгольцем в июне 1956 года [4] [13] [14] [b] на ранней стадии разработки IBM Stretch [15] [16] [1] [13] [14] [17 ]. ] [18] компьютер, который имел адресацию к инструкциям с битовой и переменной длиной поля (VFL) с размером байта, закодированным в инструкции. [13] Это намеренное respelling из укуса , чтобы избежать случайной мутации к биту . [1] [13] [19] [c]

Другое происхождение байтов для групп битов, меньших размера слова компьютера, и в частности групп из четырех битов , зафиксировано Луисом Дж. Дули, который утверждал, что придумал этот термин во время работы с Жюлем Шварцем и Диком Билером над системой противовоздушной обороны. называлась SAGE в лаборатории Линкольна Массачусетского технологического института в 1956 или 1957 году и была разработана совместно Rand , MIT и IBM. [20] [21] Позже в языке Шварца JOVIAL фактически использовался этот термин, но автор смутно напомнил, что он произошел от AN / FSQ-31 . [22] [21]

Ранние компьютеры использовали различные четырехбитные двоично-десятичные представления (BCD) и шестибитные коды для печатных графических шаблонов, распространенных в армии США ( FIELDATA ) и на флоте . Эти представления включали буквенно-цифровые символы и специальные графические символы. Эти наборы были расширены в 1963 году до семи битов кодирования, названного Американским стандартным кодом для обмена информацией (ASCII) в качестве федерального стандарта обработки информации , который заменил несовместимые коды телетайпов, используемые различными ветвями правительства США и университетами в 1960-х годах. . ASCII включает в себя различение букв верхнего и нижнего регистра и наборуправляющие символы для облегчения передачи письменного языка, а также функций печатающего устройства, таких как перемещение страницы и перевод строки, а также физическое или логическое управление потоком данных через среду передачи. [18] В начале 1960 - х годов, а также активно участвует в стандартизации ASCII, IBM одновременно представила в своей продуктовой линейки System / 360 восьмибитовый Extended Binary Coded Decimal Interchange Code (EBCDIC), расширение их шесть-бит в двоичном коде десятичное (BCDIC) представление [d], используемое в более ранних перфокартах карт. [23] Известность System / 360 привела к повсеместному внедрению восьмиразрядного хранилища, [18] [16][13] в то время как в деталях схемы кодирования EBCDIC и ASCII различаются.

В начале 1960-х годов AT&T представила цифровую телефонию на междугородних магистральных линиях . Они использовали восьмибитное кодирование по закону μ . Эти большие вложения обещали снизить затраты на передачу восьмибитных данных.

Разработка восьмиразрядных микропроцессоров в 1970-х годах способствовала популяризации такого размера памяти. Микропроцессоры, такие как Intel 8008 , прямой предшественник 8080 и 8086 , использовавшиеся в ранних персональных компьютерах, также могли выполнять небольшое количество операций с четырехбитными парами в байте, например, десятичное добавление-регулировка ( DAA) инструкция. Некоторое количество четырех бит часто называют полубайт , также Nybble , который удобно представлен одной шестнадцатеричной цифрой.

Термин октет используется для однозначного определения размера в восемь бит. [18] [12] Он широко используется в определениях протоколов .

Исторически термин « октад» или « октад» также использовался для обозначения восьми битов, по крайней мере, в Западной Европе; [24] [25] однако это использование больше не является распространенным. Точное происхождение этого термина неясно, но его можно найти в британских, голландских и немецких источниках 1960-х и 1970-х годов, а также в документации по мэйнфреймам Philips .

Символ единицы [ править ]

Символ единицы для байта определен в IEC 80000-13 , IEEE 1541 и Metric Interchange Format [10] как символ верхнего регистра B.

В Международной системе количеств (ISQ) B - это символ бел , единицы логарифмического отношения мощности, названной в честь Александра Грэхема Белла , что противоречит спецификации IEC. Однако существует небольшая опасность путаницы, потому что ремень используется редко. Он используется в основном в своей десятичной доле, децибелах (дБ), для измерения мощности сигнала и уровня звукового давления , в то время как единицы для одной десятой байта, децибайта и других дробей используются только в производных единицах, таких как скорости передачи.

Строчная буква o для октета определена как символ для октета в IEC 80000-13 и обычно используется в таких языках, как французский [26] и румынский , а также сочетается с метрическими префиксами для кратных чисел, например ko и Mo.

Термин октада (е) для восьми бит больше не используется. [24] [25]

Многобайтовые блоки [ править ]

Существует более одной системы для определения более крупных единиц на основе байта. Некоторые системы основаны на степени 10 ; другие системы основаны на степени двойки . Номенклатура этих систем была предметом путаницы. Системы, основанные на степени 10, надежно используют стандартные префиксы СИ (« кило », « мега », « гига », ...) и соответствующие им символы (k, M, G, ...). Однако системы, основанные на степени двойки , могут использовать двоичные префиксы ('kibi', 'mebi', 'gibi, ...) и соответствующие им символы (Ki, Mi, Gi, ...) или они могут использовать префиксы K, M и G, создающие двусмысленность.

Хотя числовая разница между десятичной и двоичной интерпретациями относительно мала для килобайта (примерно на 2% меньше, чем кибибайт), системы значительно отклоняются по мере увеличения единиц (относительное отклонение увеличивается на 2,4% для каждых трех порядков). Например, йоттабайт на основе мощности 10 примерно на 17% меньше йобибайта на основе мощности 2.

Единицы, основанные на степени 10 [ править ]

Определение префиксов с использованием степеней 10, в которых 1 килобайт (символ kB) равен 1000 байтам, рекомендуется Международной электротехнической комиссией (IEC). [27] Стандарт МЭК определяет восемь таких кратных, до 1 йоттабайта (YB), равных 1000 8 байтам.

Это определение наиболее часто используется для скоростей передачи данных в компьютерных сетях , внутреннюю шину, жесткий диск и скорости передачи флэш - медиа, а также для емкостей большинства носителей , в частности , жесткие диски , [28] флэш - основанное хранение, [29] и DVD . Это также согласуется с другими видами использования префиксов SI в вычислениях, такими как тактовая частота процессора или показатели производительности .

Единицы, основанные на степени двойки [ править ]

Система единиц, основанная на степени двойки, в которой 1 кибибайт (КиБ) равен 1024 (т. Е. 2 10 ) байтам, определяется международными стандартами IEC 80000-13 и поддерживается национальными и международными органами по стандартизации ( BIPM , IEC, NIST. ). Стандарт IEC определяет восемь таких кратных, до 1 йобибайта (YiB), равных 1024 8 байтам.

Альтернативная система номенклатуры для тех же единиц, в которой 1 килобайт (КБ) равен 1024 байтам, [30] [31] [32] 1 мегабайт (МБ) равен 1024 2 байтам, а 1 гигабайт (ГБ) равен равный 1024 3 байтам определяется стандартом JEDEC 1990-х годов . Только первые три кратных (до ГБ) определены стандартом JEDEC. Для TB и выше стандарты признают только десятичное определение. Соглашение JEDEC широко используется в операционной системе Microsoft Windows [33], а также в оперативной памяти , такой как основная память и кэш ЦП.размер, а также в маркетинге и выставлении счетов телекоммуникационными компаниями, такими как Vodafone , [34] AT&T , [35] Orange [36] и Telstra . [37]

История противоречивых определений [ править ]

Разница в процентах между десятичной и двоичной интерпретацией префиксов единиц увеличивается с увеличением размера хранилища.

Современная [e] компьютерная память имеет двоичную архитектуру, которая определяет единицы памяти на основе степени 2, наиболее практичной. Использование метрики приставки кило для кратных бинарного возникло как удобства, так как 1024 примерно 1000. [38] Это определение было популярно в первых десятилетиях персональных компьютеров , с такими продуктами , как Tandon 5 1 / 4 - дюймовый DD формат дискета (содержащий 368 640 байт) объявляется как «360 КБ» в соответствии с соглашением о 1024 байтах. Однако это не было универсальным. Shugart СА-400 5 1 / 4 - дюймовыйДискета содержала 109 375 байт в неформатированном виде [39] и рекламировалась как «110 Кбайт» в соответствии с соглашением о 1000. [40] Точно так же 8-дюймовая дискета DEC RX01 (1975 г.) содержала 256 256 байт отформатированных и рекламировалась как «256 КБ». [41] Другие диски были объявлены с использованием смеси из двух определений: в частности, 3 1 / 2- дюймовые HD-диски, рекламируемые как «1,44 МБ», на самом деле имеют емкость 1440 КБ, что эквивалентно 1,47 МБ или 1,41 МБ.

В 1995 году Межведомственный комитет Международного союза теоретической и прикладной химии по номенклатуре и символам попытался разрешить эту двусмысленность, предложив набор двоичных префиксов для степеней 1024. [42] [43]

В декабре 1998 года МЭК обратилась к такому множеству использований и определений, создав префиксы, такие как kibi, mebi, gibi и т. Д., Чтобы однозначно обозначить степень 1024. [44] Таким образом, кибибайт (KiB) представляет 2 10   байтов = 1024 байта. . Эти префиксы теперь являются частью Международной системы количеств . МЭК также уточнил, что килобайт должен использоваться только для ссылки на 1000 байтов. МЭК приняла предложение и опубликовала стандарт в январе 1999 года. [45] [46]

В 1999 году Дональд Кнут предложил называть кибибайт «большой килобайт» ( ККБ ). [47]

Иски по определению [ править ]

Судебные иски, возникшие из-за предполагаемой путаницы потребителей в отношении двоичных и десятичных определений, применяемых к байтам, обычно заканчиваются в пользу производителей, и суды постановили, что юридическое определение гигабайта или ГБ составляет 1 ГБ = 1 000 000 000 (10 9 ) байтов (десятичное определение), а не двоичное определение (2 30 ). В частности, суды постановили, что «Конгресс США счел десятичное определение гигабайта« предпочтительным »для целей« торговли и коммерции США »[...] Законодательное собрание Калифорнии также приняло десятичную систему для всех 'транзакции в этом состоянии.' " [48]

Ранее судебные иски заканчивались мировым соглашением без какого-либо решения суда по этому вопросу, например, иск против производителя накопителей Western Digital . [49] [50] Western Digital решила эту проблему и добавила в продукты явные оговорки о том, что полезная емкость может отличаться от заявленной. [49] Компания Seagate была привлечена к суду на аналогичных основаниях и также была урегулирована. [49] [51]

Практические примеры [ править ]

Обычное использование [ править ]

Многие языки программирования определяют байт типа данных .

В языках программирования C и C ++ байт определяется как « адресуемая единица хранения данных, достаточно большая, чтобы вместить любой член базового набора символов среды выполнения » (пункт 3.6 стандарта C). Стандарт C требует, чтобы интегральный тип данных unsigned char содержал как минимум 256 различных значений и был представлен как минимум восемью битами (пункт 5.2.4.2.1). Различные реализации C и C ++ резервируют 8, 9, 16, 32 или 36 бит для хранения байта. [57] [58] [g] Кроме того, стандарты C и C ++ требуют, чтобы между двумя байтами не было промежутков. Это означает, что каждый бит в памяти является частью байта. [59]

Примитивный byteтип данных Java всегда определяется как состоящий из 8 битов и являющийся типом данных со знаком, содержащий значения от -128 до 127.

Языки программирования .NET, такие как C #, определяют как беззнаковый, так byteи знаковый sbyte, содержащие значения от 0 до 255 и от -128 до 127 соответственно.

В системах передачи данных байт определяется как непрерывная последовательность битов в последовательном потоке данных, представляющем наименьшую выделенную единицу данных. Единица передачи может включать в себя стартовые биты, стоповые биты или биты четности и, таким образом, может варьироваться от 7 до 12 бит, чтобы содержать один 7-битный код ASCII . [60]

См. Также [ править ]

  • Данные
  • Иерархия данных
  • JBOB , просто куча байтов
  • Клев
  • Примитивный тип данных
  • Tryte
  • Qubyte (квантовый байт)
  • Word (компьютерная архитектура)

Заметки [ править ]

  1. ^ Термин «слог» использовался для байтов, содержащих инструкции или составные части инструкций, но не для байтов данных.
  2. ^ Многие источники ошибочно указывают дату рождения термина « байт» в июле 1956 года, но Вернер Бухгольц утверждал, что термин был придуман в июне 1956 года . Фактически, самый ранний документ, подтверждающий это, датируется 1956-06-11. Бухгольц заявил, что переход к 8-битным байтам был задуман в августе 1956 года , но самый ранний документ, использующий это понятие, датируется сентябрем 1956 года .
  3. ^ Некоторые более поздние машины, например Burroughs B1700 , CDC 3600 , DEC PDP-6, DEC PDP-10, имели возможность работать с произвольными байтами, не превышающими размер слова.
  4. ^ Было более одной кодовой страницы BCD.
  5. ^ В течение 1970-х годов были машины с десятичной архитектурой.
  6. ^ Видео кодируется с битрейтом 27,80 Мбит / с, время работы - 1403 мин [61] (84180 секунд), что дает приблизительный размер ~ 0,2925 терабайта.
  7. ^ Фактическое количество бит в конкретной реализации задокументированоCHAR_BITкак реализовано в файле limits.h .

Ссылки [ править ]

  1. ^ а б в Блаау, Геррит Энн ; Брукс-младший, Фредерик Филлипс ; Бухгольц, Вернер (1962), «4: Единицы естественных данных» (PDF) , в Бухгольце, Вернер (ред.), Планирование компьютерной системы - Project Stretch , McGraw-Hill Book Company, Inc. / The Maple Press Company, Йорк , PA., стр. 39-40, LCCN  61-10466 , архивируются от оригинала (PDF) на 2017-04-03 , извлекаться 2017-04-03 , термины , используемые для описания структуры , введенной конструкции машины, в помимо бит , перечислены ниже.
    Байтобозначает группу битов, используемых для кодирования символа, или количество битов, передаваемых параллельно в блоки ввода-вывода и из них. Здесь используется термин, отличный от символа , потому что данный символ может быть представлен в разных приложениях более чем одним кодом, а разные коды могут использовать разное количество битов (т. Е. Разные размеры байтов). При передаче ввода-вывода группировка битов может быть совершенно произвольной и не иметь отношения к реальным символам. (Термин придуман от укуса , но respelled , чтобы избежать случайной мутации к биту .) Слово состоит из числа бит данных , передаваемых параллельно от или к памяти в одном цикле памяти. Размер слова
    таким образом определяется как структурное свойство памяти. (Термин « катена» был придуман для этой цели разработчиками компьютера Bull GAMMA 60  [ fr ] .)
    Блок относится к количеству слов, переданных в или из устройства ввода-вывода в ответ на одну команду ввода-вывода. Размер блока - это структурное свойство устройства ввода-вывода; это могло быть исправлено разработкой или оставлено для изменения программой.
  2. ^ Bemer, Роберт Уильям (1959), "Предложение для обобщенного кода карт 256 символов", коммуникации АСМА , 2 (9): 19-23, DOI : 10,1145 / 368424,368435
  3. Перейти ↑ Postel, J. (сентябрь 1981). «Интернет-протокол» . tools.ietf.org . п. 43 . Проверено 28 августа 2020 . октет Восьмибитный байт.
  4. ^ а б Бухгольц, Вернер (1956-06-11). «7. Матрица сдвига» (PDF) . Система ссылок . IBM . С. 5–6. Информационная записка № 39G. Архивировано из оригинального (PDF) 04.04.2017 . Проверено 4 апреля 2016 . […] Наиболее важным с точки зрения редактирования будет возможность обрабатывать любые символы или цифры длиной от 1 до 6 бит.
    На рисунке 2 показана матрица сдвига, которая будет использоваться для преобразования 60-битного слова , поступающего из памяти параллельно, в символы или «байты», как мы их назвали, для последовательной отправки в сумматор . 60 бит сбрасываются вмагнитопроводы на шести разных уровнях. Таким образом, если 1 выходит из позиции 9, она появляется во всех шести ядрах ниже. Пульсирование любой диагональной линии отправит шесть битов, хранящихся в этой строке, в сумматор. Сумматор может принимать все или только некоторые биты.
    Предположим, что желательно работать с 4-битными десятичными цифрами , начиная с правого. Диагональ 0 получает импульс первой, отправляя шесть битов от 0 до 5, из которых сумматор принимает только первые четыре (0–3). Биты 4 и 5 игнорируются. Далее импульсная 4-я диагональ. Это отправляет биты с 4 по 9, из которых два последних снова игнорируются, и так далее.
    Так же просто использовать все шесть битов в буквенно-цифровомработать, или обрабатывать байты только одного бита для логического анализа, или смещать байты на любое количество бит. Все это можно сделать, потянув за соответствующие диагонали переключения передач. Аналогичное расположение матриц используется для перехода от последовательной к параллельной работе на выходе сумматора. […]
  5. ^ Компьютерная система 3600 - Справочное руководство (PDF) . К. Сент-Пол, Миннесота, США: Control Data Corporation (CDC). 1966-10-11 [1965]. 60021300. Архивировано из оригинального (PDF) 05.04.2017 . Проверено 5 апреля 2017 . Байт - раздел компьютерного слова. (NB. Обсуждаются 12-битные, 24-битные и 48-битные байты.)
  6. ^ Рао, Thammavaram RN; Фудзивара, Эйдзи (1989). Маккласки, Эдвард Дж. (Ред.). Кодирование с контролем ошибок для компьютерных систем . Серия Prentice Hall в компьютерной инженерии (1-е изд.). Энглвуд Клиффс, Нью-Джерси, США: Прентис Холл . ISBN 0-13-283953-9. LCCN  88-17892 . (NB. Пример использования кода для «4-битных байтов».)
  7. ^ Тафель, Ханс Йорг (1971). Einführung in die digitale Datenverarbeitung [ Введение в цифровую обработку информации ] (на немецком языке). Мюнхен: Карл Хансер Верлаг . п. 300. ISBN 3-446-10569-7. Byte = zusammengehörige Folge von ia neun Bits; Дэвон Синд Ахт Датенбитс, das neunte ein Prüfbit (NB. Определяет байт как группу, обычно состоящую из 9 бит; 8 бит данных плюс 1 бит четности.)
  8. ^ ISO / IEC 2382-1: 1993, Информационные технологии - Словарь - Часть 1: Основные термины . 1993. byte Строка, состоящая из нескольких битов, рассматриваемая как единое целое и обычно представляющая символ или часть символа. Примечания 1 Число битов в байте фиксировано для данной системы обработки данных. 2 Число битов в байте обычно равно 8.



  9. ^ "Музей истории компьютеров - Экспонаты - История Интернета - 1964: История Интернета с 1962 по 1992 год" . Музей истории компьютеров . 2017 [2015]. Архивировано 3 апреля 2017 года . Проверено 3 апреля 2017 .
  10. ^ a b Джаффер, Обри (2011) [2008]. «Метрика-обмен-формат» . Архивировано 3 апреля 2017 года . Проверено 3 апреля 2017 .
  11. ^ Kozierok, Чарльз М. (2005-09-20) [2001]. «Руководство TCP / IP - Двоичная информация и представление: биты, байты, полубайты, октеты и символы - байты по сравнению с октетами» . 3.0. Архивировано 3 апреля 2017 года . Проверено 3 апреля 2017 .
  12. ^ a b ISO 2382-4, Организация данных (2-е изд.). байт, октет, 8-битный байт: строка, состоящая из восьми бит.
  13. ^ а б в г д Бухгольц, Вернер (февраль 1977 г.). «Слово« Байт »достигает совершеннолетия ...» Журнал Byte . 2 (2): 144. […] Первая ссылка, найденная в файлах, содержалась во внутренней записке, написанной в июне 1956 года на заре разработки Stretch . Байт описывался как состоящий из любого числа параллельных битов от одного до шести. Таким образом, предполагалось, что длина байта соответствует случаю. Его первое использование было в контексте оборудования ввода-вывода 1950-х годов, которое обрабатывало шесть бит за раз. Возможность перехода на 8-битные байты рассматривалась в августе 1956 года и вскоре после этого была включена в конструкцию Stretch.. Первое опубликованное упоминание этого термина произошло в 1959 г. в статье « Обработка данных в битах и ​​кусках » Дж. А. Блаау , Ф. П. Брукса-младшего и В. Буххольца в IRE Transactions on Electronic Computers , июнь 1959 г., стр. 121. Понятия, содержащиеся в этой статье. были разработаны в главе 4 Планирования компьютерной системы (Project Stretch) , отредактированной В. Бухгольцем, McGraw-Hill Book Company (1962). Обоснование введения этого термина было объяснено там на странице 40 следующим образом:
    Байт обозначает группу битов, используемых для кодирования символа, или количество битов, передаваемых параллельно в блоки ввода-вывода и из них. Термин, отличный от символаиспользуется здесь, потому что данный символ может быть представлен в разных приложениях более чем одним кодом, а разные коды могут использовать разное количество битов (т. е. разные размеры байтов). При передаче ввода-вывода группировка битов может быть совершенно произвольной и не иметь отношения к реальным символам. (Термин образован от укуса , но переделан, чтобы избежать случайной мутации в бит .)
    System / 360 переняла многие концепции Stretch, включая базовые размеры байтов и слов, которые являются степенями 2. Однако для экономии байтов размер был зафиксирован на максимальном уровне 8 бит, а адресация на уровне битов была заменена байтовой адресацией. […]
  14. ^ a b «Хронология эпохи IBM Stretch / Harvest (1956–1961)» . Музей истории компьютеров . Июнь 1956. Архивировано из оригинала на 2016-04-29 . Проверено 3 апреля 2017 . 1956 Лето: Геррит Блаау , Фред Брукс , Вернер Буххольц , Джон Кок и Джим Померен присоединяются к команде Stretch . Ллойд Хантер обеспечивает лидерство в области транзисторов . 1956, июль [ sic ]: В отчете Вернер Бухгольц перечисляет преимущества 64-битной длины слова для Stretch. Он также поддерживает АНБ
    Требование к 8-битным байтам. Термин Вернера «Байт» впервые получил широкую известность в этой памятке.
    (NB. На этой временной шкале ошибочно указана дата рождения термина «байт» как июль 1956 года , тогда как Бухгольц фактически использовал этот термин еще в июне 1956 года .)
  15. ^ Бухгольц, Вернер (1956-07-31). «5. Ввод-вывод» (PDF) . Длина слова памяти . IBM . п. 2. Растягиваемая записка № 40. Архивировано из оригинала (PDF) 04.04.2017 . Проверено 4 апреля 2016 . […] 60 кратно 1, 2, 3, 4, 5 и 6. Следовательно, байты длиной от 1 до 6 битов могут быть эффективно упакованы в 60-битное слово без необходимости разделения байта между одним словом и следующий. Если бы потребовались более длинные байты, 60 бит, конечно, уже не были бы идеальными. В современных приложениях 1, 4 и 6 бит являются действительно важными случаями.
    С 64-битными словами часто приходилось идти на некоторые компромиссы, например оставлять 4 бита неиспользованными в слове при работе с 6-битными байтами на входе и выходе. Однако компьютер LINK может быть оборудован для устранения этих пробелов и для обработки байтов, разделенных между словами. […]
  16. ^ а б Бухгольц, Вернер (1956-09-19). «2. Размер байта ввода-вывода» (PDF) . Длина слова в памяти и индексация . IBM . п. 1. Растягивающая записка № 45. Архивировано из оригинала (PDF) 04.04.2017 . Проверено 4 апреля 2016 . […] Максимальный размер байта ввода-вывода для последовательной работы теперь будет 8 бит, не считая битов обнаружения и исправления ошибок. Таким образом, Exchange будет работать на основе 8-битных байтов, и любые блоки ввода-вывода с менее чем 8 битами на байт оставят оставшиеся биты пустыми. Образовавшиеся пробелы можно будет исправить позже, запрограммировав […]
  17. ^ Раймонд, Эрик Стивен (2017) [2003]. "байтовое определение" . Архивировано 3 апреля 2017 года . Проверено 3 апреля 2017 .
  18. ^ a b c d Бемер, Роберт Уильям (2008-08-08). "Почему байт 8 бит? Или нет?" . Виньетки по компьютерной истории . Архивировано из оригинала на 2017-04-03 . Проверено 3 апреля 2017 . […] Я пришел работать в IBM и увидел всю путаницу, вызванную ограничением в 64 символа. Особенно, когда мы начали думать о текстовом редакторе, который потребовал бы как верхнего, так и нижнего регистра. […] Я даже сделал предложение (ввиду STRETCH , самого первого известного мне компьютера с 8-битным байтом), которое увеличило бы количество перфокарт.коды символов до 256 […]. Некоторые люди начали думать о 7-битных символах, но это было смешно. Используя в качестве фона компьютер IBM STRETCH, обрабатывающий 64-символьные слова, которые делятся на группы по 8 (я разработал для него набор символов под руководством доктора Вернера Бухгольца , человека, который ДЕЙСТВИТЕЛЬНО ввел термин `` байт '' для 8-битных слов). группировка). […] Казалось разумным создать универсальный 8-битный набор символов, поддерживающий до 256. В те дни моей мантрой было «Силы двойки - магия». И вот группа, которую я возглавлял, разработала и обосновала такое предложение […] IBM 360используются 8-битные символы, но не ASCII напрямую. Таким образом, «байт» Бухгольца прижился повсюду. Мне самому это имя не понравилось по многим причинам. В конструкции параллельно перемещались 8 бит. Но затем появилась новая деталь IBM с 9 битами для самопроверки, как внутри ЦП, так и в ленточных накопителях . Я представил этот 9-битный байт прессе в 1973 году. Но задолго до этого, когда я руководил программным обеспечением Cie. Bull во Франции в 1965–66, я настоял на том, чтобы слово «байт» было устаревшим в пользу « октета ». […] Это оправдано новыми методами связи, которые могут передавать 16, 32, 64 и даже 128 бит параллельно. Но некоторые глупцы теперь ссылаются на «16-битный байт» из-за этой параллельной передачи, которая видна в UNICODE.набор. Я не уверен, но, может быть, это следует называть « хекстет ». […]
  19. ^ Блаау, Геррит Энн ; Брукс-младший, Фредерик Филлипс ; Бухгольц, Вернер (июнь 1959 г.). «Обработка данных в битах и ​​кусках». Операции IRE на электронных компьютерах : 121.
  20. Перейти ↑ Dooley, Louis G. (февраль 1995 г.). «Байт: Слово» . БАЙТ . Окала, Флорида, США. Архивировано из оригинала на 1996-12-20. […] Слово «байт» было придумано примерно с 1956 по 1957 год в MIT Lincoln Laboratories в рамках проекта под названием SAGE (Североамериканская система противовоздушной обороны), который был совместно разработан Rand , Lincoln Labs и IBM . В ту эпоху структура компьютерной памяти уже определялась размером слова . Слово состоит из x битов ; бит представляет двоичную позицию в слове. Операции обычно оперируют всеми битами в полном слове.
    Мы придумали слово байт для обозначения логического набора битов меньше полного размера слова. В то время он не определялся конкретно как x бит, но обычно назывался набором из 4 бит , поскольку это был размер большинства наших закодированных элементов данных. Вскоре после этого я перешел к другим обязанностям, которые отстранили меня от SAGE. Проведя много лет в Азии, я вернулся в США и был поражен, обнаружив, что слово «байт» используется в новой микрокомпьютерной технологии для обозначения базового адресуемого блока памяти.
    (NB. По словам его сына, Дули писал ему: «В хорошие дни у нас был бы XD-1 в рабочем состоянии, и все программы работали бы правильно, и тогда у нас было время просто посидеть и бездельничать, пока мы ждали, пока компьютер закончит свою работу. В одном из таких случаев я придумал слово «байт», им ( Жюлю Шварцу и Дику Билеру) оно понравилось, и мы начали использовать его между собой. Происхождение слова было необходимость ссылаться только на часть длины слова компьютера, но часть больше, чем один бит ... Многим программам приходилось обращаться только к определенному 4-битному сегменту полного слова ... Я хотел имя для этот меньший сегмент более полного слова. Слово « бит » приводит к « укусить»"(значимо меньше целого), но для уникального написания" i "могло быть" y ", и таким образом родилось слово" byte ".")
  21. ^ а б Рам, Стефан. "Erklärung des Wortes" Byte "im Rahmen der Lehre binärer Codes" (на немецком языке). Берлин, Германия: Свободный университет Берлина . Проверено 10 апреля 2017 .
  22. ^ Происхождение термина «байт», 1956 , заархивировано из оригинала 10 апреля 2017 года , получено 10 апреля 2017 года. Сессия вопросов и ответов на конференции ACM по истории языков программирования включала следующий обмен: ДЖОН ГУДЕНО : Вы упомянули, что термин «байт» используется в JOVIAL . Откуда появился термин? ДЖУЛЕС ШВАРЦ (изобретатель JOVIAL): Насколько я помню, AN / FSQ-31 , совершенно другой компьютер, чем 709 , был ориентирован на байты. Я не помню точно, но я достаточно уверен, что в описании этого компьютера было слово «байт», и мы использовали его.


    ФРЕД БРУКС : Могу я поговорить об этом? Вернер Бухгольц придумал это слово как часть определения STRETCH , а AN / FSQ-31 заимствовал его из STRETCH, но Вернер определенно является автором этого слова.
    ШВАРЦ: Верно. Спасибо.
  23. ^ «Список кодов EBCDIC от IBM» . ibm.com .
  24. ^ a b Уильямс, RH (1969-01-01). Британский коммерческий компьютерный дайджест: Pergamon Computer Data Series . Pergamon Press . ISBN 1483122107. 978-1483122106.
  25. ^ a b «Philips - Ассортимент продукции Philips Data Systems - апрель 1971 г.» (PDF) . Philips . Апрель 1971. Архивировано из оригинального (PDF) 04 марта 2016 года . Проверено 3 августа 2015 .
  26. ^ «Когда килобайт - это кибибайт? А МБ - это МиБ?» . Международная система единиц и МЭК . Международная электротехническая комиссия . Проверено 30 августа 2010 .)
  27. ^ Префиксы для двоичных кратных, заархивированные 2008-08-08 в Wayback Machine - Справочник NIST по константам, единицам и неопределенности
  28. ^ 1977 Disk / Trend Report Rigid Disk Drives, опубликовано в июне 1977 г.
  29. ^ USB-накопитель SanDisk, заархивированный 13 мая 2008 г. на Wayback Machine «Примечание: 1 мегабайт (МБ) = 1 миллион байтов; 1 гигабайт (ГБ) = 1 миллиард байт».
  30. ^ Килобайт - Определение и больше от Free Merriam-Webster Dictionary Архивированных 2010-04-09 в Wayback Machine . Merriam-webster.com (13 августа 2010 г.). Проверено 7 января 2011.
  31. ^ Килобайт | Define Kilobyte на Dictionary.com. Архивировано 1 сентября 2010 г. на Wayback Machine . Dictionary.reference.com (1995-09-29). Проверено 7 января 2011.
  32. Определение килобайта из Оксфордских словарей в Интернете. Архивировано 25 июня 2006 г. в Wayback Machine . Askoxford.com. Проверено 7 января 2011.
  33. ^ «Определение фактического размера диска: почему 1,44 МБ должно быть 1,40 МБ» . Support.microsoft.com. 2003-05-06. Архивировано 9 февраля 2014 года . Проверено 25 марта 2014 .
  34. ^ "Скорость передачи данных 3G / GPRS" . Vodafone Ireland. Архивировано 26 октября 2016 года . Проверено 26 октября +2016 .
  35. ^ «Шкала измерения данных» . AT&T . Проверено 26 октября +2016 .[ постоянная мертвая ссылка ]
  36. ^ "Мобильный доступ в Интернет" . Оранжевая Румыния. Архивировано из оригинального 26 октября 2016 года . Проверено 26 октября +2016 .
  37. ^ «Наши условия для клиентов» (PDF) . Telstra. п. 7. Архивировано 10 апреля 2017 года (PDF) . Проверено 26 октября +2016 .
  38. ^ «Префиксы для двоичных кратных» . iec.ch . Международная электротехническая комиссия. Архивировано 25 сентября 2016 года . Проверено 1 октября +2016 .
  39. ^ "Мини-дискеты SA400" . Swtpc.com. 2013-08-14. Архивировано из оригинала на 2014-05-27 . Проверено 25 марта 2014 .
  40. ^ «Архивная копия» (PDF) . Архивировано из оригинального (PDF) 08.06.2011 . Проверено 24 июня 2011 . CS1 maint: заархивированная копия как заголовок ( ссылка )
  41. ^ «Архивная копия» (PDF) . Архивировано из оригинального (PDF) 23 апреля 2011 года . Проверено 24 июня 2011 . CS1 maint: заархивированная копия как заголовок ( ссылка )
  42. ^ Отчет IUCr 1995 - Межведомственный комитет IUPAC по номенклатуре и символам (IDCNS) http://ww1.iucr.org/iucr-top/cexec/rep95/idcns.htm
  43. ^ «Двоичный префикс», Оклендский университет, факультет компьютерных наук https://wiki.cs.auckland.ac.nz/stageonewiki/index.php/Binary_prefix
  44. ^ Национальный институт стандартов и технологий . «Префиксы для двоичных кратных» . Архивировано 8 августа 2007 года.«В декабре 1998 года Международная электротехническая комиссия (МЭК) [...] утвердила в качестве международного стандарта МЭК названия и символы префиксов для двоичных кратных чисел для использования в областях обработки и передачи данных».
  45. ^ NIST «Префиксы для двоичных кратных» https://physics.nist.gov/cuu/Units/binary.html
  46. ^ Поправка 2 к международному стандарту МЭК МЭК 60027-2: Буквенные символы для использования в электротехнике - Часть 2: Телекоммуникации и электроника.
  47. ^ "Что такое килобайт?" . Проверено 20 мая 2010 .
  48. ^ "Приказ о предоставлении ходатайства об увольнении" (PDF) . Окружной суд США . Проверено 24 января 2020 .
  49. ^ a b c Мук, Нейт (28.06.2006). «Требование о пропускной способности Western Digital Settles» . Betanews . Проверено 30 марта 2009 .
  50. ^ Баскин, Скотт Д. (01.02.2006). «Записка ответчика Western Digital Corporation в поддержку ходатайства истца о предварительном одобрении» . Орин Сафье против Western Digital Corporation . Western Digital Corporation . Проверено 30 марта 2009 .
  51. ^ Судья, Питер (2007-10-26). «Seagate платит сверх гигабайта» . ZDNet . Проверено 16 сентября 2014 .
  52. Эллисон Декстер, «Сколько слов в Гарри Поттере?», [1] ; показывает 190 637 слов
  53. ^ Килобайт Мегабайт Гигабайт Терабайт (Стэнфордский университет)
  54. ^ Perenson, Melissa J. (4 января 2007). «Hitachi представляет жесткий диск емкостью 1 терабайт» . www.pcworld.com . Дата обращения 5 декабря 2020 .
  55. ^ "Как выглядит петабайт?" . Архивировано из оригинального 28 января 2018 года . Проверено 19 февраля 2018 .
  56. ^ Гросс, Грант (24 ноября 2007 г.). «Интернет может вырасти за 2 года, говорится в исследовании» . Мир ПК . Архивировано 26 ноября 2007 года . Проверено 28 ноября 2007 года .
  57. ^ Клайн, Маршалл. «Я мог представить машину с 9-битными байтами. Но уж точно не с 16-битными или 32-битными байтами, верно?» .
  58. ^ Кляйн, Джек (2008), Целочисленные типы в C и C ++ , заархивировано из оригинала 27 марта 2010 г. , получено 18 июня 2015 г.
  59. ^ Клайн, Маршалл. «C ++ FAQ: правила о байтах, символах и символах» .
  60. ^ «Внешние интерфейсы / API» . Северо-Западный университет.
  61. ^ «Аватар - Последний маг воздуха: полный сериал Blu-ray» . Blu-ray.com . Архивировано из оригинального 28 апреля 2020 года . Проверено 24 февраля 2021 года .

Дальнейшее чтение [ править ]

  • Программирование с помощью набора команд PDP-10 (PDF) . Справочное руководство по системе PDP-10. 1 . Корпорация цифрового оборудования (DEC). Август 1969. Архивировано (PDF) из оригинала 2017-04-05 . Проверено 5 апреля 2017 .
  • Эшли Тейлор. «Биты и байты». Стэнфорд. https://web.stanford.edu/class/cs101/bits-bytes.html