IEEE 754

Стандарт IEEE для арифметики с плавающей точкой ( IEEE 754 с ) представляет собой технический стандарт для арифметики с плавающей точкой , установленной в 1985 году Институтом инженеров электротехники и электроники (IEEE). Стандарт решает многие проблемы, обнаруженные в различных реализациях с плавающей запятой, которые затрудняют их надежное и портативное использование . Многие аппаратные устройства с плавающей запятой используют стандарт IEEE 754.

Стандарт определяет:

арифметические форматы: наборы двоичных и десятичных данных с плавающей запятой, которые состоят из конечных чисел (включая нули со знаком и субнормальные числа ), бесконечности и специальных «не числовых » значений ( NaN ).
форматы обмена: кодировки (битовые строки), которые могут использоваться для обмена данными с плавающей запятой в эффективной и компактной форме
правила округления: свойства, которые должны выполняться при округлении чисел во время арифметических операций и преобразований
операции: арифметические и другие операции (например, тригонометрические функции ) с арифметическими форматами
обработка исключений: указание на исключительные условия (например, деление на ноль , переполнение и т. д. )

IEEE 754-2008 , опубликованный в августе 2008 года, включает почти весь исходный стандарт IEEE 754-1985 , а также стандарт IEEE 854-1987 для не зависящей от основания арифметики с плавающей запятой . Текущая версия IEEE 754-2019 была опубликована в июле 2019 года. ^[1] Это небольшая редакция предыдущей версии, включающая в основном пояснения, исправления дефектов и новые рекомендуемые операции.

Стандартная разработка [ править ]

Первый стандарт арифметики с плавающей запятой, IEEE 754-1985 , был опубликован в 1985 году. Он охватывал только двоичную арифметику с плавающей запятой.

Новая версия IEEE 754-2008 была опубликована в августе 2008 года после семилетнего процесса пересмотра под председательством Дэна Зураса и редактором Майка Коулишоу . Он заменил IEEE 754-1985 (двоичная арифметика с плавающей запятой) и стандарт IEEE 854-1987 для Radix-независимой арифметики с плавающей запятой . Двоичные форматы исходного стандарта включены в этот новый стандарт вместе с тремя новыми базовыми форматами, одним двоичным и двумя десятичными. Чтобы соответствовать текущему стандарту, реализация должна реализовывать по крайней мере один из основных форматов как арифметический формат и как формат обмена.

Международный стандарт ISO / IEC / IEEE 60559: 2011 (с содержанием, идентичным IEEE 754-2008) был одобрен для принятия через JTC1 / SC 25 в соответствии с соглашением ISO / IEEE PSDO ^[2] и опубликован. ^[3]

Текущая версия IEEE 754-2019, опубликованная в июле 2019 года, является производной и заменяет IEEE 754-2008 после процесса пересмотра, начатого в сентябре 2015 года под председательством Дэвида Г. Хау и отредактированным Майком Коулишоу. Он включает в себя в основном пояснения (например, totalOrder ) и исправления дефектов (например, minNum ), но также включает некоторые новые рекомендуемые операции (например, augmentedAddition ). ^[4]^[5]

Международный стандарт ISO / IEC 60559: 2020 (с содержанием, идентичным IEEE 754-2019) был одобрен для принятия через JTC1 / SC 25 и опубликован. ^[6]

Форматы [ править ]

Формат IEEE 754 - это «набор представлений числовых значений и символов». Формат также может включать способ кодирования набора. ^[7]

Формат с плавающей запятой определяется следующим образом:

основание (также называемое основанием системы счисления ) b , которое равно 2 (двоичное) или 10 (десятичное) в IEEE 754;
точность p ;
диапазон экспоненты от emin до emax , где emin = 1 - emax для всех форматов IEEE 754.

Формат включает:

Конечные числа, которые можно описать тремя целыми числами: s = знак (ноль или единица), c = значащая величина (или коэффициент ), имеющая не более p цифр при записи по основанию b (т. Е. Целое число в диапазоне от 0 до 0). to b ^p - 1), и q = показатель такой, что emin ≤ q + p - 1 ≤ emax . Числовое значение такого конечного числа равно (−1) ^s × c × b ^q . ^[а]Кроме того, есть два нулевых значения, называемые нулями со знаком: бит знака определяет, равен ли ноль +0 (положительный ноль) или -0 (отрицательный ноль).
Две бесконечности: + ∞ и −∞.
Два вида NaN (не числа): тихий NaN (qNaN) и сигнальный NaN (sNaN).

Например, если b = 10, p = 7 и emax = 96, то emin = −95, мантисса удовлетворяет 0 ≤ c ≤9 999 999 , а показатель степени удовлетворяет условию −101 ≤ q ≤ 90. Следовательно, наименьшее ненулевое положительное число, которое может быть представлено, равно 1 × 10 ⁻¹⁰¹ , а наибольшее - 9999999 × 10 ⁹⁰ (9,999999 × 10 ⁹⁶ ), поэтому полный диапазон чисел составляет от -9,999999 × 10 ⁹⁶ до 9,999999 × 10 ⁹⁶ . Числа - b ^{1− emax} и b ^{1− emax} (здесь −1 × 10 ⁻⁹⁵ и 1 × 10 ⁻⁹⁵ ) - наименьшие (по величине) нормальные числа ; ненулевые числа между этими наименьшими числами называются субнормальными числами.

Представление и кодирование в памяти [ править ]

Некоторые числа могут иметь несколько возможных представлений в экспоненциальном формате. Например, если b = 10 и p = 7, то −12,345 может быть представлено как −12345 × 10 ⁻³ , −123450 × 10 ⁻⁴ и −1234500 × 10 ⁻⁵ . Однако для большинства операций, таких как арифметические операции, результат (значение) не зависит от представления входных данных.

Для десятичных форматов допустимо любое представление, и набор этих представлений называется когортой . Если результат может иметь несколько представлений, стандарт определяет, какой член когорты выбран.

Для двоичных форматов представление становится уникальным путем выбора наименьшего представимого показателя степени, позволяющего точно представить значение. Кроме того, показатель степени не представлен напрямую, но добавляется смещение, так что наименьший представимый показатель степени представлен как 1, а 0 используется для субнормальных чисел. Для чисел с показателем в нормальном диапазоне (поле показателя не содержит ни всех единиц, ни всех нулей), ведущий бит мантиссы всегда будет равен 1. Следовательно, ведущая единица может подразумеваться, а не присутствовать явно в кодировании памяти, и по стандарту явно представленная часть мантиссы будет находиться между 0 и 1. Это правило называется соглашением о начальных битах , неявным соглашением о битах или соглашением о скрытых битах.. Это правило позволяет двоичному формату иметь дополнительную точность. Соглашение о начальных битах не может использоваться для субнормальных чисел, поскольку они имеют показатель степени за пределами диапазона нормального показателя и масштабируются по наименьшей представленной экспоненте, используемой для наименьших нормальных чисел.

Из-за возможности множественного кодирования (по крайней мере, в форматах, называемых форматами обмена ), NaN может нести другую информацию: знаковый бит (который не имеет значения, но может использоваться некоторыми операциями) и полезную нагрузку , которая предназначена для диагностики. информация, указывающая на источник NaN (но полезная нагрузка может иметь другое использование, например, NaN-бокс ^[8]^[9]^[10] ).

Основные и обменные форматы [ править ]

Стандарт определяет пять основных форматов, названных по их числовой базе и количеству битов, используемых при их обменном кодировании. Существует три основных двоичных формата с плавающей запятой (с 32-, 64- или 128-битной кодировкой) и два основных десятичных формата с плавающей запятой (с 64- или 128-битной кодировкой). В binary32 и binary64 форматах являются одиночными и двойными форматами IEEE 754-1985 соответственно. Соответствующая реализация должна полностью реализовывать хотя бы один из основных форматов.

Стандарт также определяет форматы обмена , которые обобщают эти основные форматы. ^[11] Для двоичных форматов требуется соглашение о начальных битах. В следующей таблице приведены самые маленькие форматы обмена (включая основные).

Имя	Распространенное имя	Основание	Значащие биты ^[b] или цифры	Десятичные цифры	Биты экспоненты	Десятичный E макс.	Смещение экспоненты ^[12]	E мин	E макс	Примечания
двоичный16	Половинная точность	2	11	3,31	5	4,51	2 ⁴ −1 = 15	−14	+15	не базовый
двоичный32	Одинарная точность	2	24	7,22	8	38,23	2 ⁷ -1 = 127	−126	+127
двоичный64	Двойная точность	2	53	15,95	11	307,95	2 ¹⁰ -1 = 1023	−1022	+1023
двоичный128	Четверная точность	2	113	34,02	15	4931,77	2 ¹⁴ -1 = 16383	−16382	+16383
двоичный256	Восьмеричная точность	2	237	71,34	19	78913,2	2 ¹⁸ -1 = 262143	−262142	+262143	не базовый
десятичный32		10	7	7	7,58	96	101	−95	+96	не базовый
десятичный64		10	16	16	9,58	384	398	−383	+384
десятичный128		10	34	34	13,58	6144	6176	−6143	+6144

Обратите внимание, что в приведенной выше таблице минимальные показатели указаны для нормальных чисел; специальное представление субнормальных чисел позволяет представлять даже меньшие числа (с некоторой потерей точности). Например, наименьшее положительное число, которое может быть представлено в двоичном формате 64, равно 2 ⁻¹⁰⁷⁴ ; вклады в фигуру -1074 включают значение E min -1022 и все, кроме одного, из 53 битов значащей (2 ^{-1022 - (53-1)} = 2 ^-1074 ).

Десятичные цифры - это цифры × log _{10 по} основанию . Это дает приблизительную точность в количестве десятичных цифр.

Десятичный E max равен Emax × log _{10 по} основанию . Это дает приблизительное значение максимального десятичного показателя степени.

Форматы binary32 (одиночный) и binary64 (двойной) - два наиболее распространенных формата, используемых сегодня. На рисунке ниже показана абсолютная точность для обоих форматов в диапазоне значений. Этот рисунок может использоваться для выбора подходящего формата с учетом ожидаемого значения числа и требуемой точности.

Точность binary32 и binary64 в диапазоне от 10 ⁻¹² до 10 ¹²

Пример макета для 32-битной плавающей запятой :

и 64-битный макет аналогичен .

Расширенные и расширяемые форматы точности [ править ]

Стандарт определяет необязательные расширенные и расширяемые форматы точности, которые обеспечивают большую точность, чем базовые форматы. ^[13] Формат повышенной точности расширяет базовый формат за счет большей точности и большего диапазона экспонент. Расширяемый формат точности позволяет пользователю определять точность и диапазон экспоненты. Реализация может использовать любое внутреннее представление, выбранное для таких форматов; все, что необходимо определить, - это его параметры ( b , p и emax ). Эти параметры однозначно описывают набор конечных чисел (комбинации знака, значащей и экспоненты для данного основания системы счисления), которые он может представлять.

Стандарт рекомендует, чтобы языковые стандарты обеспечивали метод определения p и emax для каждой поддерживаемой базы b . ^[14] Стандарт рекомендует, чтобы языковые стандарты и реализации поддерживали расширенный формат, который имеет большую точность, чем самый большой базовый формат, поддерживаемый для каждого основания b . ^[15] Для расширенного формата с точностью между двумя основными форматами диапазон экспоненты должен быть таким же большим, как и у следующего более широкого базового формата. Так, например, 64-битное двоичное число с расширенной точностью должно иметь emax не менее 16383. 80-битный расширенный формат x87 соответствует этому требованию.

Форматы обмена [ править ]

Форматы обмена предназначены для обмена данными с плавающей запятой с использованием битовой строки фиксированной длины для данного формата.

Двоичный [ править ]

Для обмена двоичными числами с плавающей запятой определены форматы обмена длиной 16 бит, 32 бита, 64 бита и любое кратное 32 бит ≥ 128 ^[c] . 16-битный формат предназначен для обмена или хранения небольших чисел (например, для графики).

Кодирующая схема для этих бинарных форматов обмена такой же , как и IEEE 754-1985: бит знака, а затем ш показателя бит , которые описывают показатель степени смещения с помощью смещения , а р - 1 бит , которые описывают мантиссу. Ширина поля экспоненты для k- битного формата вычисляется как w = round (4 log ₂ ( k )) - 13. Существующие 64- и 128-битные форматы следуют этому правилу, но 16- и 32-битные форматы имеют больше битов экспоненты (5 и 8 соответственно), чем дает эта формула (3 и 7 соответственно).

Как и в стандарте IEEE 754-1985, поле смещенной экспоненты заполняется всеми 1 битами, чтобы указать либо бесконечность (конечное поле значимости = 0), либо NaN (конечное поле значимости ≠ 0). Для NaN, тихие NaN и сигнальные NaN различаются исключительно использованием самого старшего бита конечного поля значимой ^[d], а полезная нагрузка переносится в оставшихся битах.

Десятичный [ править ]

Для обмена десятичными числами с плавающей запятой определены форматы обмена, кратные 32 битам. Как и в случае двоичного обмена, схема кодирования для форматов десятичного обмена кодирует знак, показатель степени и значение. Определены две разные кодировки битового уровня, и обмен затруднен тем фактом, что может потребоваться некоторый внешний индикатор используемой кодировки.

Эти две опции позволяют кодировать мантиссу как сжатую последовательность десятичных цифр с использованием плотно упакованного десятичного числа или, альтернативно, как двоичное целое число . Первый более удобен для прямой аппаратной реализации стандарта, а второй больше подходит для программной эмуляции на двоичном компьютере. В любом случае набор чисел (комбинации знака, значащей и экспоненты), которые могут быть закодированы, идентичен, а специальные значения (± ноль с минимальным показателем, ± бесконечность, тихие NaN и сигнальные NaN) имеют идентичное кодирование.

Правила округления [ править ]

Стандарт определяет пять правил округления. Первые два правила округляются до ближайшего значения; остальные называются направленными округлениями :

Округление до ближайшего [ править ]

Округлить до ближайшего, связать с четным - округление до ближайшего значения; если число выпадает на полпути, оно округляется до ближайшего значения с четной младшей цифрой; это значение по умолчанию для двоичных чисел с плавающей запятой и рекомендованное значение по умолчанию для десятичных.
Округлить до ближайшего, завязать от нуля - округление до ближайшего значения; если число падает на полпути, оно округляется до ближайшего значения выше (для положительных чисел) или ниже (для отрицательных чисел); это предназначено как опция для десятичных чисел с плавающей запятой.

Направленные округления [ править ]

Округление в сторону 0 - направленное округление в сторону нуля (также известное как усечение ).
Округление в сторону + ∞ - направленное округление в сторону положительной бесконечности (также известное как округление вверх или потолок ).
Округление в сторону −∞ - направленное округление в сторону отрицательной бесконечности (также известное как округление вниз или пол ).

Пример округления до целых чисел с использованием правил IEEE 754
Режим	Пример значения
Режим	+11,5	+12,5	-11,5	-12,5
до ближайшего, привязки к четному	+12,0	+12,0	-12,0	-12,0
до ближайшего, привязки от нуля	+12,0	+13,0	-12,0	-13,0
к 0	+11,0	+12,0	-11,0	-12,0
в сторону + ∞	+12,0	+13,0	-11,0	-12,0
в сторону −∞	+11,0	+12,0	-12,0	-13,0

Если не указано иное, результат операции с плавающей запятой определяется путем применения функции округления к бесконечно точному (математическому) результату. Такая операция называется правильно округленной . Это требование называется правильным округлением . ^[16]

Необходимые операции [ править ]

Обязательные операции для поддерживаемого арифметического формата (включая основные форматы) включают:

Арифметические операции (сложение, вычитание, умножение, деление, извлечение квадратного корня, объединенное умножение – сложение , остаток) ^[17]^[18]
Преобразования (между форматами, в и из строк и т. Д. ) ^[19]^[20]
Масштабирование и (для десятичных) квантование ^[21]^[22]
Копирование и изменение знака (абс, отрицание и т. Д. ) ^[23]
Сравнения и общий заказ ^[24]^[25]
Классификация и тестирование NaN и т. Д. ^[26]
Тестирование и установка флагов ^[27]
Разные операции. ^{[ указать ]}

Предикаты сравнения [ править ]

Стандарт предоставляет предикаты сравнения для сравнения одного элемента данных с плавающей запятой с другим в поддерживаемом арифметическом формате. ^[28] Любое сравнение с NaN считается неупорядоченным. −0 и +0 сравниваются как равные.

Предикат общего порядка [ править ]

Стандарт предоставляет предикат totalOrder , который определяет общий порядок канонических элементов поддерживаемого арифметического формата. ^[29] Предикат согласуется с предикатами сравнения, когда одно число с плавающей запятой меньше другого. TotalOrder предикат не налагает полный порядок на все кодировки в формате. В частности, он не делает различий между разными кодировками одного и того же представления с плавающей запятой, как когда одна или обе кодировки являются неканоническими. ^[30] IEEE 754-2019 включает пояснения к totalOrder .

Обработка исключений [ править ]

Стандарт определяет пять исключений, каждое из которых возвращает значение по умолчанию и имеет соответствующий флаг состояния, который поднимается при возникновении исключения. ^[e] Никакой другой обработки исключений не требуется, но рекомендуются дополнительные альтернативы не по умолчанию (см. § Альтернативная обработка исключений ).

Пять возможных исключений:

Недопустимая операция: математически не определено, например , квадратный корень из отрицательного числа. По умолчанию возвращает qNaN.
Деление на ноль: операция с конечными операндами дает точный бесконечный результат, например 1/0 или log (0). По умолчанию возвращает ± бесконечность.
Переполнение: результат слишком велик для правильного представления ( т. Е. Его показатель степени с неограниченным диапазоном показателей будет больше, чем emax ). По умолчанию возвращает ± бесконечность для режимов округления до ближайшего (и следует правилам округления для режимов направленного округления).
Недополнение: результат очень мал (вне нормального диапазона) и неточен. По умолчанию возвращает субнормальное значение или ноль (в соответствии с правилами округления).
Неточность: точный ( т. Е. Неокругленный) результат не представляется точно. По умолчанию возвращает правильно округленный результат.

Это те же пять исключений, которые определены в IEEE 754-1985, но исключение деления на ноль было распространено на операции, отличные от деления.

Для десятичных чисел с плавающей запятой существуют дополнительные исключения: ^[31]^[32]

Фиксировано: показатель степени результата слишком велик для формата назначения. По умолчанию к коэффициенту добавляются завершающие нули, чтобы уменьшить показатель степени до наибольшего полезного значения. Если это невозможно (потому что это приведет к тому, что количество цифр должно быть больше, чем формат назначения), возникает исключение переполнения.
Округлено: для коэффициента результата требуется больше цифр, чем предоставляет формат назначения. Если отбрасываются любые ненулевые цифры, сигнализируется неточное исключение.

Кроме того, такие операции, как квантование, когда один из операндов бесконечен или когда результат не соответствует формату назначения, также будут сигнализировать об исключении недопустимой операции. ^[33]

При использовании десятичного формата с плавающей запятой десятичное представление будет сохранено с использованием:

7 десятичных цифр для decimal32,
16 десятичных цифр для decimal64,
34 десятичных цифры для decimal 128.

Алгоритмы с кодом для корректного преобразования из двоичного в десятичное и из десятичного в двоичное обсуждают Гей ^[47], а для тестирования - Паксон и Кахан. ^[48]

См. Также [ править ]

bfloat16 формат с плавающей запятой
Binade
Сопроцессор
C99 для примеров кода, демонстрирующих доступ и использование функций IEEE 754.
Арифметика с плавающей запятой для истории, обоснования дизайна и примера использования функций IEEE 754.
Арифметика с фиксированной точкой для альтернативного подхода к вычислениям с рациональными числами (особенно полезно, когда диапазон экспоненты известен, фиксирован или ограничен во время компиляции).
IBM System z9 , первый процессор, реализующий десятичную арифметику IEEE 754-2008 (с использованием аппаратного микрокода).
IBM z10 , IBM z196 , IBM zEC12 и IBM z13 - процессоры, которые полностью аппаратно реализуют десятичную арифметику IEEE 754-2008.
ISO / IEC 10967 , Арифметика , не зависящая от языка (LIA).
Minifloat , двоичные форматы с плавающей запятой низкой точности, соответствующие принципам IEEE 754.
Процессоры POWER6 , POWER7 и POWER8, которые полностью аппаратно реализуют десятичную арифметику IEEE 754-2008.
strictfp , ключевое слово в языке программирования Java , ограничивающее арифметические операции до одинарной и двойной точности IEEE 754, чтобы обеспечить воспроизводимость на обычных аппаратных платформах.
Дилемма изготовителя стола для получения дополнительной информации о правильном округлении функций.
Стандартная среда Apple Numerics
Коническая плавающая точка

Примечания [ править ]

^ Например, если основание равно 10, знак равен 1 (обозначает отрицательное значение), мантисса равна 12345, а показатель степени равен −3, тогда значение числа будет (−1) ¹ × 12345 × 10 ⁻³ = −1 × 12345 × 0,001 = −12,345.
^ включая неявный бит (который всегда равен 1 для нормальных чисел и 0 для субнормальных чисел. Этот неявный бит не сохраняется в памяти), но не знаковый бит.
^ В отличие от десятичного, двоичного формата обмена длиной 96 бит не существует. Однако такой формат все еще разрешен как формат без обмена.
^ Стандарт рекомендует 0 для сигнализации NaN, 1 для тихих NaN, так что сигнализация NaN может быть заморожена путем изменения только этого бита на 1, в то время как обратное может привести к кодированию бесконечности.
^ В некоторых случаях недостаточного заполнения флаг не поднимается.

Ссылки [ править ]

^ IEEE 754 2019
^ «FW: ISO / IEC / IEEE 60559 (IEEE Std 754-2008)» . grouper.ieee.org . Архивировано из оригинала на 2017-10-27 . Проверено 4 апреля 2018 .
^ «ISO / IEC / IEEE 60559: 2011 - Информационные технологии - Микропроцессорные системы - Арифметика с плавающей запятой» . www.iso.org . Проверено 4 апреля 2018 .
^ a b Коулишоу, Майк (13 ноября 2013 г.). «Опечатки IEEE 754-2008» . speleotrove.com . Проверено 24 января 2020 .
^ «Пересмотр ANSI / IEEE Std 754-2008» . ucbtest.org . Проверено 4 апреля 2018 .
^ «ISO / IEC 60559: 2020 - Информационные технологии - Микропроцессорные системы - Арифметика с плавающей точкой» . www.iso.org . Проверено 25 октября 2020 .
^ IEEE 754 2008 , §2.1.27.
^ "SpiderMonkey Internals" . developer.mozilla.org . Проверено 11 марта 2018 .
^ Клеменс, Бен (сентябрь 2014). 21-й век C: C Советы от новой школы . O'Reilly Media, Incorporated. п. 160. ISBN 9781491904442. Проверено 11 марта 2018 .
^ "zuiderkwast / nanbox: NaN-бокс в C" . GitHub . Проверено 11 марта 2018 .
^ IEEE 754 2008 , §3.6.
^ Cowlishaw, Майк. «Десятичные арифметические кодировки» (PDF) . IBM . Проверено 6 августа 2015 .
^ IEEE 754 2008 , §3.7.
^ IEEE 754 2008 , §3.7 утверждает: «Языковые стандарты должны определять механизмы, поддерживающие расширяемую точность для каждого поддерживаемого основания».
^ IEEE 754 2008 , §3.7 гласит: «Языковые стандарты или реализации должны поддерживать формат с расширенной точностью, который расширяет самый широкий базовый формат, поддерживаемый в этой системе счисления».
^ IEEE 754 2019 , §2.1
^ IEEE 754 2008 , §5.3.1
^ IEEE 754 2008 , §5.4.1
^ IEEE 754 2008 , §5.4.2
^ IEEE 754 2008 , §5.4.3
^ IEEE 754 2008 , §5.3.2
^ IEEE 754 2008 , §5.3.3
^ IEEE 754 2008 , §5.5.1
^ IEEE 754 2008 , §5.10
^ IEEE 754 2008 , §5.11
^ IEEE 754 2008 , §5.7.2
^ IEEE 754 2008 , §5.7.4
^ IEEE 754 2019 , §5.11
^ IEEE 754 2019 , §5.10
^ IEEE 754 2019 , §5.10
^ «9.4. Decimal - Десятичная арифметика с фиксированной и плавающей запятой - документация Python 3.6.5» . docs.python.org . Проверено 4 апреля 2018 .
^ «Десятичная арифметика - исключительные условия» . speleotrove.com . Проверено 4 апреля 2018 .
^ IEEE 754 2008 , §7.2 (h)
^ IEEE 754 2019 , §9.2
^ IEEE 754 2008 , пункт 9
^ IEEE 754 2019 , §9.2.
^ "Re: Отсутствуют функции tanPi, asinPi и acosPi" . grouper.ieee.org . Архивировано из оригинала на 2017-07-06 . Проверено 4 апреля 2018 .
^ IEEE 754 2008 , §9.3.
^ IEEE 754 2008 , §9.4.
^ IEEE 754 2019 , §9.5.
^ Риди, Джейсон; Деммель, Джеймс. «Расширенные арифметические операции, предлагаемые для IEEE-754 2018» (PDF) . 25-я конференция IEEE Symbosium по компьютерной арифметике (ARITH 2018). С. 49–56. Архивировано (PDF) из оригинала 23.07.2019 . Проверено 23 июля 2019 .
^ «Версия 754 намечена на 2019 год» . 754r.ucbtest.org . Проверено 23 июля 2019 .
^ IEEE 754 2019 , §9.6.
^ Чен, Дэвид. «Удаление операций MinNum и MaxNum из IEEE 754-2019» (PDF) . grouper.ieee.org . Проверено 5 февраля 2020 .
^ IEEE 754 2008 , §5.12.
^ IEEE 754 2008 , §5.12.2.
^ Гей, Дэвид М. (1990-11-30). «Правильно округленные двоично-десятичные и десятично-двоичные преобразования» . Рукопись численного анализа. Мерри Хилл, Нью-Джерси, США: AT&T Laboratories. 90-10. Cite journal requires |journal= (help)
^ Паксон, Верн; Кахан, Уильям (1991-05-22). «Программа для тестирования десятичного-двоичного преобразования IEEE». Рукопись. CiteSeerX 10.1.1.144.5889 . Cite journal requires |journal= (help)

Стандарты [ править ]

Компьютерное общество IEEE (29 августа 2008 г.). Стандарт IEEE для арифметики с плавающей запятой . IEEE STD 754-2008 . IEEE. С. 1–70. DOI : 10.1109 / IEEESTD.2008.4610935 . ISBN 978-0-7381-5753-5. IEEE Std 754-2008.
IEEE Computer Society (22.07.2019). Стандарт IEEE для арифметики с плавающей запятой . IEEE STD 754-2019 . IEEE. С. 1–84. DOI : 10.1109 / IEEESTD.2019.8766229 . ISBN 978-1-5044-5924-2. IEEE Std 754-2019.
ISO / IEC / IEEE 60559: 2011 - Информационные технологии - Микропроцессорные системы - Арифметика с плавающей запятой . Iso.org. Июнь 2011. С. 1–58.
ISO / IEC 60559: 2020 - Информационные технологии - Микропроцессорные системы - Арифметика с плавающей запятой . Iso.org. Май 2020. С. 1–74.

Вторичные ссылки [ править ]

Десятичная арифметика с плавающей запятой , ответы на часто задаваемые вопросы, библиография и ссылки
Сравнение двоичных чисел с плавающей запятой
Справочный материал IEEE 754
IEEE 854-1987 - История и протоколы
Дополнительные чтения для IEEE 754 . Включает исторические перспективы.

Дальнейшее чтение [ править ]

Голдберг, Дэвид (март 1991). «Что должен знать каждый компьютерный ученый об арифметике с плавающей точкой» . ACM Computing Surveys . 23 (1): 5–48. DOI : 10.1145 / 103162.103163 . S2CID 222008826 . Проверено 8 марта 2019 .
Хеккер, Крис (февраль 1996 г.). «Давайте перейдем к (плавающей) точке» (PDF) . Журнал разработчика игр : 19–24. ISSN 1073-922X .
Северанс, Чарльз (март 1998 г.). «IEEE 754: Интервью с Уильямом Каханом» (PDF) . Компьютер IEEE . 31 (3): 114–115. DOI : 10,1109 / MC.1998.660194 . S2CID 33291145 . Проверено 8 марта 2019 .
Коулишоу, Майк (июнь 2003 г.). «Десятичные числа с плавающей запятой: алгоритм для компьютеров». 16-й симпозиум IEEE по компьютерной арифметике, 2003 г. Труды (PDF) . Труды 16-го симпозиума IEEE по компьютерной арифметике . Лос-Аламитос, Калифорния: Компьютерное общество IEEE. С. 104–111. DOI : 10,1109 / ARITH.2003.1207666 . ISBN 978-0-7695-1894-7. S2CID 18713046 . Проверено 14 ноября 2014 .. (Примечание. Алгоризм - это не неправильное написание названия; см. Также алгоритм .)
Моннио, Дэвид (май 2008 г.). «Подводные камни проверки вычислений с плавающей запятой» . Транзакции ACM по языкам и системам программирования . 30 (3): 1–41. arXiv : cs / 0701192 . DOI : 10.1145 / 1353445.1353446 . ISSN 0164-0925 . S2CID 218578808 .: Краткое изложение неинтуитивного поведения операций с плавающей запятой на популярных архитектурах с последствиями для проверки и тестирования программ.
Мюллер, Жан-Мишель; Бруни, Николас; де Динешен, Флоран; Жаннерод, Клод-Пьер; Джолдес, Миоара; Лефевр, Винсент; Мелькионд, Гийом; Revol, Натали; Торрес, Серж (2018) [2010]. Справочник по арифметике с плавающей точкой (2-е изд.). Birkhäuser . DOI : 10.1007 / 978-3-319-76526-6 . ISBN 978-3-319-76525-9.
Овертон, Майкл Л. (2001). Написано в Институте математических наук Куранта , Нью-Йоркский университет , Нью-Йорк, США. Численные вычисления с использованием арифметики с плавающей запятой IEEE (1-е изд.). Филадельфия, США: SIAM . DOI : 10.1137 / 1.9780898718072 . ISBN 978-0-89871-482-1. 978-0-89871-571-2, 0-89871-571-7.
Клив Молер о числах с плавающей запятой
Биби, Нельсон Х.Ф. (22.08.2017). Справочник по математическим функциям - Программирование с использованием переносимой программной библиотеки MathCW (1-е изд.). Солт-Лейк-Сити, Юта, США: Springer International Publishing AG . DOI : 10.1007 / 978-3-319-64110-2 . ISBN 978-3-319-64109-6. LCCN 2017947446 . S2CID 30244721 .
Хаф, Дэвид Г. (декабрь 2019 г.). «Стандарт IEEE 754: один для книг по истории» . Компьютер . IEEE . 52 (12): 109–112. DOI : 10,1109 / MC.2019.2926614 . S2CID 208281213 .

Внешние ссылки [ править ]

В Викибуке с плавающей запятой есть страница на тему: специальные числа, указанные в стандарте IEEE 754

Викискладе есть медиафайлы по теме IEEE 754 .

Страницы IEEE: 754-1985 - Стандарт IEEE для двоичной арифметики с плавающей запятой , 754-2008 - Стандарт IEEE для арифметики с плавающей запятой , 754-2019 - Стандарт IEEE для арифметики с плавающей запятой
Бинарные калькуляторы IEEE 754 онлайн

[8] Например, если основание равно 10, знак равен 1 (обозначает отрицательное значение), мантисса равна 12345, а показатель степени равен −3, тогда значение числа будет (−1) ¹ × 12345 × 10 ⁻³ = −1 × 12345 × 0,001 = −12,345.

[13] включая неявный бит (который всегда равен 1 для нормальных чисел и 0 для субнормальных чисел. Этот неявный бит не сохраняется в памяти), но не знаковый бит.

[18] ^ В отличие от десятичного, двоичного формата обмена длиной 96 бит не существует. Однако такой формат все еще разрешен как формат без обмена.

[19] Стандарт рекомендует 0 для сигнализации NaN, 1 для тихих NaN, так что сигнализация NaN может быть заморожена путем изменения только этого бита на 1, в то время как обратное может привести к кодированию бесконечности.

[35] В некоторых случаях недостаточного заполнения флаг не поднимается.

[1] IEEE 754 2019

[2] «FW: ISO / IEC / IEEE 60559 (IEEE Std 754-2008)» . grouper.ieee.org . Архивировано из оригинала на 2017-10-27 . Проверено 4 апреля 2018 .

[3] «ISO / IEC / IEEE 60559: 2011 - Информационные технологии - Микропроцессорные системы - Арифметика с плавающей запятой» . www.iso.org . Проверено 4 апреля 2018 .

[IEEE754-errata-4] Коулишоу, Майк (13 ноября 2013 г.). «Опечатки IEEE 754-2008» . speleotrove.com . Проверено 24 января 2020 .

[5] «Пересмотр ANSI / IEEE Std 754-2008» . ucbtest.org . Проверено 4 апреля 2018 .

[6] «ISO / IEC 60559: 2020 - Информационные технологии - Микропроцессорные системы - Арифметика с плавающей точкой» . www.iso.org . Проверено 25 октября 2020 .

[7] IEEE 754 2008 , §2.1.27.

[9] "SpiderMonkey Internals" . developer.mozilla.org . Проверено 11 марта 2018 .

[10] Клеменс, Бен (сентябрь 2014). 21-й век C: C Советы от новой школы . O'Reilly Media, Incorporated. п. 160. ISBN 9781491904442. Проверено 11 марта 2018 .

[11] "zuiderkwast / nanbox: NaN-бокс в C" . GitHub . Проверено 11 марта 2018 .

[12] IEEE 754 2008 , §3.6.

[DAE-14] Cowlishaw, Майк. «Десятичные арифметические кодировки» (PDF) . IBM . Проверено 6 августа 2015 .

[15] IEEE 754 2008 , §3.7.

[16] IEEE 754 2008 , §3.7 утверждает: «Языковые стандарты должны определять механизмы, поддерживающие расширяемую точность для каждого поддерживаемого основания».

[17] IEEE 754 2008 , §3.7 гласит: «Языковые стандарты или реализации должны поддерживать формат с расширенной точностью, который расширяет самый широкий базовый формат, поддерживаемый в этой системе счисления».

[20] IEEE 754 2019 , §2.1

[21] IEEE 754 2008 , §5.3.1

[22] IEEE 754 2008 , §5.4.1

[23] IEEE 754 2008 , §5.4.2

[24] IEEE 754 2008 , §5.4.3

[25] IEEE 754 2008 , §5.3.2

[26] IEEE 754 2008 , §5.3.3

[27] IEEE 754 2008 , §5.5.1

[total-ordering-28] IEEE 754 2008 , §5.10

[29] IEEE 754 2008 , §5.11

[30] IEEE 754 2008 , §5.7.2

[31] IEEE 754 2008 , §5.7.4

[32] IEEE 754 2019 , §5.11

[33] IEEE 754 2019 , §5.10

[34] IEEE 754 2019 , §5.10

[36] «9.4. Decimal - Десятичная арифметика с фиксированной и плавающей запятой - документация Python 3.6.5» . docs.python.org . Проверено 4 апреля 2018 .

[37] «Десятичная арифметика - исключительные условия» . speleotrove.com . Проверено 4 апреля 2018 .

[38] IEEE 754 2008 , §7.2 (h)

[39] IEEE 754 2019 , §9.2

[40] IEEE 754 2008 , пункт 9

[41] IEEE 754 2019 , §9.2.

[42] "Re: Отсутствуют функции tanPi, asinPi и acosPi" . grouper.ieee.org . Архивировано из оригинала на 2017-07-06 . Проверено 4 апреля 2018 .

[43] IEEE 754 2008 , §9.3.

[44] IEEE 754 2008 , §9.4.

[45] IEEE 754 2019 , §9.5.

[Riedy_2018-46] Риди, Джейсон; Деммель, Джеймс. «Расширенные арифметические операции, предлагаемые для IEEE-754 2018» (PDF) . 25-я конференция IEEE Symbosium по компьютерной арифметике (ARITH 2018). С. 49–56. Архивировано (PDF) из оригинала 23.07.2019 . Проверено 23 июля 2019 .

[Revision_2019-47] «Версия 754 намечена на 2019 год» . 754r.ucbtest.org . Проверено 23 июля 2019 .

[48] IEEE 754 2019 , §9.6.

[49] Чен, Дэвид. «Удаление операций MinNum и MaxNum из IEEE 754-2019» (PDF) . grouper.ieee.org . Проверено 5 февраля 2020 .

[50] IEEE 754 2008 , §5.12.

[51] IEEE 754 2008 , §5.12.2.

[52] Гей, Дэвид М. (1990-11-30). «Правильно округленные двоично-десятичные и десятично-двоичные преобразования» . Рукопись численного анализа. Мерри Хилл, Нью-Джерси, США: AT&T Laboratories. 90-10. Cite journal requires |journal= (help)

[53] Паксон, Верн; Кахан, Уильям (1991-05-22). «Программа для тестирования десятичного-двоичного преобразования IEEE». Рукопись. CiteSeerX 10.1.1.144.5889 . Cite journal requires |journal= (help)

[1]

vтеСписок стандартов Международной электротехнической комиссии
Стандарты IEC	IEC 60027 IEC 60034 IEC 60038 IEC 60062 IEC 60063 IEC 60068 IEC 60112 IEC 60228 IEC 60269 IEC 60297 IEC 60309 IEC 60320 IEC 60364 IEC 60446 IEC 60559 IEC 60601 IEC 60870 IEC 60870-5 МЭК 60870-6 IEC 60906-1 IEC 60908 IEC 60929 IEC 60958 AES3 S / PDIF IEC 61030 IEC 61131 IEC 61131-3 МЭК 61131-9 IEC 61158 IEC 61162 IEC 61334 IEC 61346 IEC 61355 IEC 61360 IEC 61400 IEC 61499 IEC 61508 IEC 61511 IEC 61784 МЭК 61850 МЭК 61851 МЭК 61883 IEC 61960 IEC 61968 IEC 61970 IEC 62014-4 IEC 62026 IEC 62056 IEC 62061 IEC 62196 IEC 62262 IEC 62264 IEC 62304 IEC 62325 IEC 62351 IEC 62365 IEC 62366 IEC 62379 IEC 62386 IEC 62455 IEC 62680 IEC 62682 IEC 62700 IEC 63110 IEC 63119
Стандарты ISO / IEC	ISO / IEC 646 ISO / IEC 2022 ISO / IEC 4909 ISO / IEC 5218 ISO / IEC 6429 ISO / IEC 6523 ISO / IEC 7810 ISO / IEC 7811 ISO / IEC 7812 ISO / IEC 7813 ISO / IEC 7816 ISO / IEC 7942 ISO / IEC 8613 ISO / IEC 8632 ISO / IEC 8652 ISO / IEC 8859 ISO / IEC 9126 ISO / IEC 9293 ISO / IEC 9496 ISO / IEC 9529 ISO / IEC 9592 ISO / IEC 9593 ISO / IEC 9899 ISO / IEC 9945 ISO / IEC 9995 ISO / IEC 10021 ИСО / МЭК 10116 ISO / IEC 10165 ISO / IEC 10179 ISO / IEC 10646 ISO / IEC 10967 ИСО / МЭК 11172 ISO / IEC 11179 ISO / IEC 11404 ISO / IEC 11544 ISO / IEC 11801 ISO / IEC 12207 ISO / IEC 13250 ISO / IEC 13346 ИСО / МЭК 13522-5 ISO / IEC 13568 ISO / IEC 13816 ISO / IEC 13818 ISO / IEC 14443 ISO / IEC 14496 ISO / IEC 14651 ISO / IEC 14750 ISO / IEC 14882 ISO / IEC 15288 ISO / IEC 15291 ISO / IEC 15408 ISO / IEC 15444 ISO / IEC 15445 ISO / IEC 15504 ISO / IEC 15511 ISO / IEC 15693 ISO / IEC 15897 ISO / IEC 15938 ISO / IEC 16262 ISO / IEC 17024 ISO / IEC 17025 ISO / IEC 18000 ISO / IEC 18004 ISO / IEC 18014 ISO / IEC 19752 ISO / IEC 19757 ISO / IEC 19770 ISO / IEC 19788 ISO / IEC 20000 ISO / IEC 21000 ISO / IEC 21827 ISO / IEC 23000 ISO / IEC 23003 ISO / IEC 23008 ISO / IEC 23270 ISO / IEC 23360 ISO / IEC 24707 ISO / IEC 24727 ISO / IEC 24744 ISO / IEC 24752 ISO / IEC 26300 ISO / IEC 27000 ISO / IEC серии 27000 ISO / IEC 27002 ISO / IEC 27040 ISO / IEC 29110 ISO / IEC 29119 ISO / IEC 33001 ISO / IEC 38500 ISO / IEC 42010 ISO / IEC 80000
Связанный	Международная электротехническая комиссия