Minifloat

‹Приведенный ниже шаблон ( необходим эксперт ) рассматривается для удаления. См. Шаблоны для обсуждения, чтобы помочь достичь консенсуса. ›

Эта статья требует внимания эксперта в области вычислений . Добавьте причину или параметр обсуждения в этот шаблон, чтобы объяснить проблему со статьей. WikiProject Computing может помочь нанять эксперта. ( Июнь 2007 г. )

Форматы с плавающей точкой
IEEE 754
16 бит : половина (двоичный 16) 32-разрядный : одиночный (binary32), decimal32 64-разрядная версия : Double (binary64), decimal64 128-битное : четверное (двоичное128), десятичное128 256-битное : Octuple (binary256) 40 или 80 бит : повышенная точность
Другой
Minifloat bfloat16 Двоичный формат Microsoft Архитектура IBM с плавающей запятой Posit G.711 8-битные числа с плавающей запятой Произвольная точность
v т е

Разрядность архитектуры компьютера
Кусочек
1 4 8 12 16 18 24 26 28 30 31 год 32 36 40 45 48 60 64 128 256 512 битовая нарезка
Заявление
8 16 32 64
Двоичная точность с плавающей запятой
16 (× ½) 24 32 (× 1) 40 64 (× 2) 80 128 (× 4) 256 (× 8)
Десятичная точность с плавающей запятой
32 64 128
v т е

В вычислениях , minifloats являются плавающей точкой значение представлено с очень немногими битами . Как и ожидалось, они плохо подходят для численных расчетов общего назначения. Они используются для специальных целей, чаще всего в компьютерной графике, где итерации небольшие, а точность имеет эстетические эффекты. ^{[ необходима цитата ]} Машинное обучение также использует аналогичные форматы, такие как bfloat16 . Кроме того, они часто используются в качестве педагогического инструмента на курсах информатики для демонстрации свойств и структуры арифметики с плавающей запятой и чисел IEEE 754 .

Минифлоты с 16 битами являются числами половинной точности (в отличие от одинарной и двойной точности ). Также есть минифлоты с 8 битами или даже меньше.

Minifloat может быть разработан в соответствии с принципами стандарта IEEE 754 . В этом случае они должны подчиняться (не написанным явно) правилам для границы между субнормальными и нормальными числами и должны иметь специальные шаблоны для бесконечности и NaN . Нормализованные числа хранятся со смещенной экспонентой . В новой редакции стандарта IEEE 754-2008 есть 16-битные двоичные минифлоты .

Radeon R300 и R420 , графические процессоры использовали «FP24» формат с плавающей точкой с 7 битами экспоненты и 16 бит (+1 неявных) от мантиссы. ^[1] «Полная точность» в Direct3D 9.0 - это собственный 24-битный формат с плавающей запятой. Графический API Microsoft D3D9 (Shader Model 2.0) изначально поддерживал как FP24 (как в чипе ATI R300), так и FP32 (как в чипе NV30 от Nvidia) как «Полная точность», а также FP16 как «Частичная точность» для вычислений вершинных и пиксельных шейдеров. выполняется графическим оборудованием.

Обозначение [ править ]

Минифлот обычно описывается набором из четырех чисел ( S , E , M , B ):

S - длина поля знака. Обычно это либо 0, либо 1.
E - длина поля экспоненты.
M - длина поля мантиссы (мантиссы).
B - смещение экспоненты .

Формат минифлота, обозначенный ( S , E , M , B ), поэтому имеет длину $S + E + M$ бит.

В компьютерной графике минифлоты иногда используются для представления только целых значений. Если в то же время должны существовать субнормальные значения, наименьшее субнормальное число должно быть 1. В этом случае значение смещения будет $B = E - M - 1$ , при условии, что для каждого IEEE используются два специальных значения показателя степени.

Обозначение ( S , E , M , B ) может быть преобразовано в формат ( B , P , L , U ) как $(2, M + 1, B + 1, 2 S - B)$ (с использованием IEEE показателей степени) .

Пример [ править ]

Макет примера 8-битного минифлота (1.4.3. − 2)
знак	показатель степени				значимое
7	6	5	4	3	2	1	0

В этом примере для представления целочисленных значений используется минифлот в 1 байт (8 бит) с 1 битом знака, 4 битами экспоненты и 3 битами значащей (короче, минифлот 1.4.3.-2). Все принципы IEEE 754 должны действовать. Единственное свободное значение - это смещение экспоненты , которое мы определяем как -2 для целых чисел. Неизвестный показатель называется моментом x .

Числа с другим основанием помечаются как ... _{основание} , например, 101 ₂ = 5. В битовых шаблонах есть пробелы для визуализации их частей.

Представление нуля [ править ]

0 0000 000 = 0

Субнормальные числа [ править ]

Мантисса расширяется на «0»:

0 0000 001 = 0,001 ₂ × 2 ^x = 0,125 × 2 ^x = 1 (наименьшее субнормальное число)...0 0000111 = 0,111 ₂ × 2 ^x = 0,875 × 2 ^x = 7 (наибольшее субнормальное число)

Нормализованные числа [ править ]

Значение увеличивается на «1»:

0 0001 000 = 1.000 ₂ × 2 ^x = 1 × 2 ^x = 8 (наименьшее нормализованное число)0 0001001 = 1,001 ₂ × 2 ^x = 1,125 × 2 ^x = 9...0 0010 000 = 1.000 ₂ × 2 ^{x +1} = 1 × 2 ^{x +1} = 160 00100001 = 1,001 ₂ × 2 ^{x +1} = 1,125 × 2 ^{x +1} = 18...0 1110 000 = 1.000 ₂ × 2 ^{x +13} = 1.000 × 2 ^{x +13} = 655360 11100001 = 1,001 ₂ × 2 ^{x +13} = 1,125 × 2 ^{x +13} = 73728...0 1110110 = 1,110 ₂ × 2 ^{x +13} = 1,750 × 2 ^{x +13} = 1146880 1110111 = 1,111 ₂ × 2 ^{x +13} = 1,875 × 2 ^{x +13} = 122880 (наибольшее нормализованное число)

Бесконечность [ править ]

0 1111 000 = + бесконечность1 1111 000 = - бесконечность

Если бы поле экспоненты не обрабатывалось специально, значение было бы

0 1111 000 = 1.000 ₂ × 2 ^{x +14} = 2 ¹⁷ = 131072

Не число [ править ]

x 1111 yyy = NaN (если yyy ≠ 000)

Без специальной обработки IEEE 754 наибольшего показателя степени наибольшее возможное значение было бы

0 1111111 = 1,111 ₂ × 2 ^{x +14} = 1,875 × 2 ¹⁷ = 245760

Значение смещения [ править ]

Если наименьшее субнормальное значение (вторая строка выше) должно быть 1 ^{[ требуется ссылка ]} , значение x должно быть x = 3. Следовательно, смещение должно быть -2 ^{[ требуется ссылка ]} ; то есть каждый сохраненный показатель должен быть уменьшен на -2 или должен быть увеличен на 2, чтобы получить числовой показатель степени.

Все значения как десятичные [ править ]

Это диаграмма всех возможных значений при обращении с поплавком так же, как с поплавком IEEE.

	... 000	... 001	... 010	... 011	... 100	... 101	... 110	... 111
0 0000 ...	0	0,125	0,25	0,375	0,5	0,625	0,75	0,875
0 0001 ...	1	1,125	1,25	1,375	1.5	1,625	1,75	1,875
0 0010 ...	2	2,25	2,5	2,75	3	3,25	3.5	3,75
0 0011 ...	4	4.5	5	5.5	6	6.5	7	7,5
0 0100 ...	8	9	10	11	12	13	14	15
0 0101 ...	16	18	20	22	24	26	28	30
0 0110 ...	32	36	40	44	48	52	56	60
0 0111 ...	64	72	80	88	96	104	112	120
0 1000 ...	128	144	160	176	192	208	224	240
0 1001 ...	256	288	320	352	384	416	448	480
0 1010 ...	512	576	640	704	768	832	896	960
0 1011 ...	1024	1152	1280	1408	1536	1664	1792	1920 г.
0 1100 ...	2048	2304	2560	2816	3072	3328	3584	3840
0 1101 ...	4096	4608	5120	5632	6144	6656	7168	7680
0 1110 ...	8192	9216	10240	11264	12288	13312	14336	15360
0 1111 ...	Inf	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1 0000 ...	-0	-0,125	-0,25	-0,375	-0,5	-0,625	-0,75	-0,875
1 0001 ...	-1	-1,125	-1,25	-1,375	-1,5	-1,625	-1,75	-1,875
1 0010 ...	-2	-2,25	-2,5	-2,75	-3	-3,25	-3,5	-3,75
1 0011 ...	-4	-4,5	-5	-5,5	-6	-6,5	-7	-7,5
1 0100 ...	−8	−9	−10	−11	−12	−13	−14	−15
1 0101 ...	−16	−18	−20	−22	−24	−26	−28	−30
1 0110 ...	−32	−36	−40	-44	−48	−52	−56	−60
1 0111 ...	−64	−72	−80	-88	−96	−104	−112	−120
1 1000 ...	−128	−144	−160	−176	−192	−208	−224	−240
1 1001 ...	−256	−288	−320	−352	−384	−416	−448	−480
1 1010 ...	−512	-576	−640	−704	−768	−832	−896	−960
1 1011 ...	−1024	−1152	−1280	−1408	−1536	−1664	−1792	−1920
1 1100 ...	−2048	−2304	−2560	−2816	−3072	−3328	−3584	−3840
1 1101 ...	−4096	−4608	−5120	−5632	−6144	−6656	−7168	−7680
1 1110 ...	−8192	−9216	−10240	−11264	−12288	−13312	−14336	−15360
1 1111 ...	−Inf	NaN	NaN	NaN	NaN	NaN	NaN	NaN

Все значения как целые числа [ править ]

Из-за серьезной нехватки точности с 8-битными числами с плавающей запятой рекомендуется использовать их только с масштабированием до целых значений.

	... 000	... 001	... 010	... 011	... 100	... 101	... 110	... 111
0 0000 ...	0	1	2	3	4	5	6	7
0 0001 ...	8	9	10	11	12	13	14	15
0 0010 ...	16	18	20	22	24	26	28	30
0 0011 ...	32	36	40	44	48	52	56	60
0 0100 ...	64	72	80	88	96	104	112	120
0 0101 ...	128	144	160	176	192	208	224	240
0 0110 ...	256	288	320	352	384	416	448	480
0 0111 ...	512	576	640	704	768	832	896	960
0 1000 ...	1024	1152	1280	1408	1536	1664	1792	1920 г.
0 1001 ...	2048	2304	2560	2816	3072	3328	3584	3840
0 1010 ...	4096	4608	5120	5632	6144	6656	7168	7680
0 1011 ...	8192	9216	10240	11264	12288	13312	14336	15360
0 1100 ...	16384	18432	20480	22528	24576	26624	28672	30720
0 1101 ...	32768	36864	40960	45056	49152	53248	57344	61440
0 1110 ...	65536	73728	81920	90112	98304	106496	114688	122880
0 1111 ...	Inf	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1 0000 ...	−0	−1	−2	−3	−4	−5	−6	−7
1 0001 ...	−8	−9	−10	−11	−12	−13	−14	−15
1 0010 ...	−16	−18	−20	−22	−24	−26	−28	−30
1 0011 ...	−32	−36	−40	-44	−48	−52	−56	−60
1 0100 ...	−64	−72	−80	-88	−96	−104	−112	−120
1 0101 ...	−128	−144	−160	−176	−192	−208	−224	−240
1 0110 ...	−256	−288	−320	−352	−384	−416	−448	−480
1 0111 ...	−512	-576	−640	−704	−768	−832	−896	−960
1 1000 ...	−1024	−1152	−1280	−1408	−1536	−1664	−1792	−1920
1 1001 ...	−2048	−2304	−2560	−2816	−3072	−3328	−3584	−3840
1 1010 ...	−4096	−4608	−5120	−5632	−6144	−6656	−7168	−7680
1 1011 ...	−8192	−9216	−10240	−11264	−12288	−13312	−14336	−15360
1 1100 ...	−16384	−18432	−20480	−22528	−24576	−26624	−28672	−30720
1 1101 ...	−32768	−36864	−40960	−45056	−49152	−53248	−57344	−61440
1 1110 ...	−65536	−73728	−81920	−90112	−98304	−106496	−114688	−122880
1 1111 ...	−Inf	NaN	NaN	NaN	NaN	NaN	NaN	NaN

Однако на практике поплавки точно не отображаются. ^{[ необходима цитата ]} Вместо этого они округлены; например, если у числа с плавающей запятой было около 3 значащих цифр и было представлено число 8192, оно было бы округлено до 8190, чтобы избежать ложной точности , в противном случае число, подобное 1000000, преобразованное в такое число с плавающей запятой и обратно, будет неправильно показано как, например, , 1000448. ^{[ необходима ссылка ]}

Свойства этого примера [ править ]

Графическое представление интегральных (1.4.3. − 2) минифлотов

Целые минифлоты в 1 байте имеют больший диапазон ± 122880, чем целые числа с дополнением до двух с диапазоном от -128 до +127. Большой диапазон компенсируется плохой точностью, потому что имеется только 4 бита мантиссы, что эквивалентно чуть более чем одному десятичному знаку. У них также больший диапазон, чем у минифлота половинной точности с диапазоном ± 65 504, что также компенсируется отсутствием дроби и низкой точностью.

Есть только 242 различных значения (если +0 и -0 считаются разными), потому что 14 битовых комбинаций представляют NaN.

Значения от 0 до 16 имеют тот же битовый шаблон, что и minifloat или целое число с дополнением до двух. Первый шаблон с другим значением - 00010001, что составляет 18 как минифлот и 17 как целое число с дополнением до двух.

Это совпадение вообще не происходит с отрицательными значениями, потому что этот минифлот является форматом величины со знаком.

Вертикальная реальная линия справа ясно показывает изменяющуюся плотность значений с плавающей запятой - свойство, общее для любой системы с плавающей запятой. Эта изменяющаяся плотность приводит к кривой, подобной экспоненциальной функции.

Хотя кривая может казаться плавной, это не так. График фактически состоит из различных точек, и эти точки лежат на отрезках с дискретными наклонами. Значение битов экспоненты определяет абсолютную точность битов мантиссы, и именно эта точность определяет наклон каждого линейного сегмента.

Арифметика [ править ]

Дополнение [ править ]

Добавление (1.3.2.3) -минифлотов

На графике показано добавление еще меньших (1.3.2.3) минифлотов с 6 битами. Эта система с плавающей запятой в точности следует правилам IEEE 754. NaN как операнд всегда дает результат NaN. Inf - Inf и (−Inf) + Inf также приводят к NaN (зеленая область). Inf можно увеличивать и уменьшать на конечные значения без изменений. Суммы с конечными операндами могут дать бесконечный результат (например, 14.0 + 3.0 = + Inf, так как результат - это голубая область, -Inf - пурпурная область). Диапазон конечных операндов заполнен кривыми x + y = c , где c всегда является одним из представимых значений с плавающей запятой (синий и красный для положительных и отрицательных результатов соответственно).

Вычитание, умножение и деление [ править ]

Остальные арифметические операции можно проиллюстрировать аналогично:

Вычитание
Умножение
Разделение

Во встроенных устройствах [ править ]

Minifloat также обычно используется во встроенных устройствах, особенно на микроконтроллерах, где в любом случае необходимо будет эмулировать операции с плавающей запятой в программном обеспечении. Для ускорения вычислений мантисса обычно занимает ровно половину битов, поэтому граница регистра автоматически обращается к частям без сдвига.

См. Также [ править ]

Арифметика с фиксированной точкой
Двоичное масштабирование
Формат с плавающей запятой половинной точности
bfloat16 формат с плавающей запятой
G.711 A-закон

Ссылки [ править ]

↑ Бак, Ян (13 марта 2005 г.), «Глава 32. Погружение в вычисления на GPU» , в Pharr, Matt (ed.), GPU Gems , ISBN 0-321-33559-7, дата обращения 5 апреля 2018.

Мунафо, Роберт (15 мая 2016 г.). «Обзор форматов с плавающей запятой» . Дата обращения 8 августа 2016 .

Дальнейшее чтение [ править ]

Хронос Вулкан беззнаковый 11-битный формат с плавающей запятой
Хронос Вулкан беззнаковый 10-битный формат с плавающей запятой

Внешние ссылки [ править ]

OpenGL половинный плавающий пиксель

[1] Бак, Ян (13 марта 2005 г.), «Глава 32. Погружение в вычисления на GPU» , в Pharr, Matt (ed.), GPU Gems , ISBN 0-321-33559-7, дата обращения 5 апреля 2018.

vтеТипы данных
Неинтерпретированный	Кусочек Байт Трит Tryte Слово Битовый массив
Числовой	Произвольная точность или bignum Сложный Десятичный Фиксированная точка Плавающая точка Двойная точность Повышенная точность Длинный дубль Восьмеричная точность Четверная точность Одинарная точность Пониженная точность Minifloat Половинная точность bfloat16 Целое число подпись Интервал Рациональный
Указатель	Адрес физический виртуальный Ссылка
Текст	Характер Нить оканчивающийся нулем
Композитный	Алгебраический тип данных обобщенный Множество Ассоциативный массив Учебный класс Зависимый Равенство Индуктивный Пересечение Список Объект метаобъект Тип варианта Товар Запись или структура Уточнение Набор Союз отмечен
Другой	Булево Нижний тип Коллекция Нумерованный тип Исключение Тип функции Непрозрачный тип данных Рекурсивный тип данных Семафор Транслировать Тип верха Типовой класс Тип объекта Пустота
Связанные темы	Абстрактный тип данных Структура данных Универсальный вид метакласс Тип объекта Параметрический полиморфизм Примитивный тип данных Протокол интерфейс Подтип Конструктор типов Преобразование типов Система типов Теория типов Переменная