В вычислении , операции с плавающей точкой в секунду ( FLOPS , флоп или флоп / с ) является мера производительности компьютера , полезной в области научных вычислений , которые требуют с плавающей точкой вычислений. Для таких случаев это более точная мера, чем измерение инструкций в секунду .
Имя | Ед. изм | Значение |
---|---|---|
килограмм ФЛОПЫ | kFLOPS | 10 3 |
мега шлепки | MFLOPS | 10 6 |
гига FLOPS | GFLOPS | 10 9 |
тера шлепки | Тфлопс | 10 12 |
ПЕТА ФЛОПЫ | PFLOPS | 10 15 |
exa FLOPS | EFLOPS | 10 18 |
zetta FLOPS | ZFLOPS | 10 21 |
yotta FLOPS | YFLOPS | 10 24 |
Арифметика с плавающей точкой
Арифметика с плавающей запятой необходима для очень больших или очень маленьких действительных чисел или вычислений, требующих большого динамического диапазона. Представление с плавающей точкой похоже на научную нотацию, за исключением того, что все выполняется по основанию два, а не десять. Схема кодирования хранит знак, показатель степени (в основе два для Cray и VAX , в основе два или десять для форматов с плавающей запятой IEEE и в базе 16 для архитектуры IBM с плавающей запятой ) и Significand (число после точки счисления ). Хотя используется несколько аналогичных форматов, наиболее распространенным является ANSI / IEEE Std. 754–1985 . Этот стандарт определяет формат для 32-битных чисел, называемых одинарной точностью , а также для 64-битных чисел, называемых двойной точностью, и более длинных чисел, называемых расширенной точностью (используется для промежуточных результатов). Представления с плавающей запятой могут поддерживать гораздо более широкий диапазон значений, чем с фиксированной запятой, с возможностью представлять очень маленькие числа и очень большие числа. [1]
Динамический диапазон и точность
Возведение в степень, присущее вычислениям с плавающей запятой, обеспечивает гораздо больший динамический диапазон - наибольшие и наименьшие числа, которые могут быть представлены, - что особенно важно при обработке наборов данных, где некоторые данные могут иметь чрезвычайно большой диапазон числовых значений или где диапазон может быть непредсказуемым. Таким образом, процессоры с плавающей запятой идеально подходят для приложений с интенсивными вычислениями. [2]
Вычислительная производительность
FLOPS и MIPS - это единицы измерения производительности вычислительных машин компьютера. Операции с плавающей запятой обычно используются в таких областях, как научные вычислительные исследования. Единица MIPS измеряет целочисленную производительность компьютера. Примеры целочисленных операций включают перемещение данных (от A к B) или проверку значений (если A = B, то C). MIPS в качестве эталона производительности подходит, когда компьютер используется для запросов к базе данных, обработки текстов, электронных таблиц или для запуска нескольких виртуальных операционных систем. [3] [4] Фрэнк Х. МакМахон из Ливерморской национальной лаборатории Лоуренса изобрел термины FLOPS и MFLOPS (мегафлопс), чтобы он мог сравнивать суперкомпьютеры того времени по количеству вычислений с плавающей запятой, которые они выполняли в секунду. Это было намного лучше, чем использование распространенного MIPS для сравнения компьютеров, поскольку эта статистика обычно мало влияла на арифметические возможности машины.
FLOPS в системе HPC можно рассчитать с помощью этого уравнения: [5]
.
Это можно упростить до наиболее распространенного случая: компьютер с ровно 1 процессором:
.
FLOPS может быть записан с различными показателями точности, например, в списке суперкомпьютеров TOP500 компьютеры ранжируются по 64-битным ( формат с плавающей запятой двойной точности ) операциям в секунду, сокращенно FP64 . [6] Подобные меры доступны для 32-битных ( FP32 ) и 16-битных ( FP16 ) операций.
Количество FLOP на цикл на ядро для различных процессоров
Микроархитектура | ЭТО | FP64 | FP32 | FP16 |
---|---|---|---|---|
Процессор Intel | ||||
Intel 80486 | x87 (32-бит) | ? | 0,128 [7] | ? |
Intel P5 Pentium Intel P6 Pentium Pro | x87 (32-бит) | ? | 0,5 [7] | ? |
Intel P5 Pentium MMX Intel P6 Pentium II | MMX (64-бит) | ? | 1 [8] | ? |
Intel P6 Pentium III | SSE (64-бит) | ? | 2 [8] | ? |
Intel Netburst Pentium 4 (Willamette, Northwood) | SSE2 (64-бит) | 2 | 4 | ? |
Intel P6 Pentium M | SSE2 (64-бит) | 1 | 2 | ? |
Intel Netburst Pentium 4 (Prescott, Cedar Mill) Intel Netburst Pentium D (Smithfield, Presler) Intel P6 Core ( Yonah ) | SSE3 (64-бит) | 2 | 4 | ? |
Intel Core ( Merom , Penryn ) Intel Nehalem [9] ( Nehalem , Westmere ) | SSSE3 (128 бит) SSE4 (128 бит) | 4 | 8 | ? |
Intel Atom ( Bonnell , Saltwell , Silvermont и Goldmont ) | SSE3 (128 бит) | 2 | 4 | ? |
Intel Sandy Bridge ( Sandy Bridge , Ivy Bridge ) | AVX (256 бит) | 8 | 16 | 0 |
Intel Haswell [9] ( Haswell , Devil's Canyon , Broadwell ) Intel Skylake ( Skylake , Kaby Lake , Coffee Lake , Comet Lake , Whisky Lake , Amber Lake ) | AVX2 и FMA (256 бит) | 16 | 32 | 0 |
Intel Xeon Phi ( Уголок рыцарей ) | SSE и FMA (256 бит) | 16 | 32 | 0 |
Intel Skylake-X Intel Xeon Phi ( Knights Landing , Knights Mill ) Intel Ice Lake , Tiger Lake и Rocket Lake | AVX-512 и FMA (512 бит) | 32 | 64 | 0 |
Процессор AMD | ||||
AMD Bobcat | AMD64 (64-разрядная) | 2 | 4 | 0 |
AMD Ягуар AMD Пума | AVX (128 бит) | 4 | 8 | 0 |
AMD K10 | SSE4 / 4a (128 бит) | 4 | 8 | 0 |
AMD Bulldozer [9] ( Piledriver , Steamroller , Excavator ) | AVX (128-бит) Бульдозер-Steamroller AVX2 (128 бит) Экскаватор FMA3 (Бульдозер) [10] FMA3 / 4 (Пиледривер-Экскаватор) | 4 | 8 | 0 |
AMD Zen (серия Ryzen 1000, серия Threadripper 1000, Эпик Неаполь ) AMD Zen + [9] [11] [12] [13] (серия Ryzen 2000, серия Threadripper 2000) | AVX2 и FMA (128-битное, 256-битное декодирование) [14] | 8 | 16 | 0 |
AMD Zen 2 [15] (серия Ryzen 3000, серия Threadripper 3000, Epyc Rome )) AMD Zen 3 (серия Ryzen 5000) | AVX2 и FMA (256 бит) | 16 | 32 | 0 |
ARM CPU | ||||
ARM Cortex-A7, A9, A15 | ARMv7 | 1 | 8 | 0 |
ARM Cortex-A32, A35, A53, A55, A72 , A73 , A75 | ARMv8 | 2 | 8 | 0 |
ARM Cortex- A57 [9] | ARMv8 | 4 | 8 | 0 |
ARM Cortex- A76 , A77 , A78 | ARMv8 | 8 | 16 | 0 |
ARM Cortex-X1 | ARMv8 | 16 | 32 | ? |
Qualcomm Krait | ARMv8 | 1 | 8 | 0 |
Qualcomm Kryo (1xx - 3xx) | ARMv8 | 2 | 8 | 0 |
Qualcomm Kryo (4xx - 5xx) | ARMv8 | 8 | 16 | 0 |
Samsung Exynos M1 и M2 | ARMv8 | 2 | 8 | 0 |
Samsung Exynos M3 и M4 | ARMv8 | 3 | 12 | 0 |
IBM PowerPC A2 (Blue Gene / Q) | ? | 8 | 8 (как FP64) | 0 |
Hitachi SH-4 [16] [17] | SH-4 | 1 | 7 | 0 |
Графический процессор Nvidia | ||||
Nvidia кюри ( GeForce 6 серии и GeForce 7 -й серии ) | PTX | ? | 8 | ? |
Nvidia Tesla 2.0 (GeForce GTX 260-295) | PTX | ? | 2 | ? |
Nvidia Fermi (только GeForce GTX 465–480, 560 Ti, 570-590) | PTX | 1/4 (заблокировано драйвером, 1 аппаратно) | 2 | 0 |
Nvidia Fermi (только Quadro 600-2000) | PTX | 1/8 | 2 | 0 |
Nvidia Fermi (только Quadro 4000–7000, Tesla) | PTX | 1 | 2 | 0 |
Nvidia Kepler (GeForce (кроме Titan и Titan Black), Quadro (кроме K6000), Tesla K10) | PTX | 1/12 (для GK110 : заблокировано драйвером, 2/3 аппаратно) | 2 | 0 |
Nvidia Kepler (GeForce GTX Titan и Titan Black, Quadro K6000, Tesla (кроме K10)) | PTX | 2/3 | 2 | 0 |
Nvidia Maxwell Nvidia Pascal (все, кроме Quadro GP100 и Tesla P100) | PTX | 1/16 | 2 | 1/32 |
Nvidia Pascal (только Quadro GP100 и Tesla P100) | PTX | 1 | 2 | 4 |
Nvidia Volta [18] | PTX | 1 | 2 ( FP32 ) + 2 ( INT32 ) | 16 |
Nvidia Turing (только GeForce 16XX ) | PTX | 1/16 | 2 (FP32) + 2 (INT32) | 4 |
Nvidia Turing (все, кроме GeForce 16XX ) | PTX | 1/16 | 2 (FP32) + 2 (INT32) | 16 |
Nvidia Ampere [19] [20] (только Tesla A100 / A30) | PTX | 2 | 2 (FP32) + 2 (INT32) | 32 |
Nvidia Ampere (все GeForce и Quadro, Tesla A40 / A10) | PTX | 1/32 | 2 (FP32) + 0 (INT32) или 1 (FP32) + 1 (INT32) | 8 |
AMD GPU | ||||
AMD TeraScale 1 ( серия Radeon HD 4000 ) | TeraScale 1 | 0,4 | 2 | ? |
AMD TeraScale 2 ( серия Radeon HD 5000 ) | TeraScale 2 | 1 | 2 | ? |
AMD TeraScale 3 ( серия Radeon HD 6000 ) | TeraScale 3 | 1 | 4 | ? |
AMD GCN (только Radeon Pro WX 2100-7100) | GCN | 1/8 | 2 | 2 |
AMD GCN (все, кроме Radeon VII, Instinct MI50 и MI60, Radeon Pro WX 2100-7100) | GCN | 1/8 | 2 | 4 |
AMD GCN Vega 20 (только Radeon VII) | GCN | 1/2 (заблокировано драйвером, 1 аппаратно) | 2 | 4 |
AMD GCN Vega 20 (только Radeon Instinct MI50 / MI60 и Radeon Pro VII) | GCN | 1 | 2 | 4 |
AMD RDNA [21] [22] AMD RDNA 2 | РДНА | 1/8 | 2 | 4 |
AMD CDNA | CDNA | 1 | 4 (FP32) | 16 |
Qualcomm GPU | ||||
Qualcomm Adreno 5x0 | Adreno 5xx | 1 | 2 | 4 |
Qualcomm Adreno 6x0 | Adreno 6xx | 1 | 2 | 4 |
Graphcore | ||||
Graphcore Colossus GC2 [23] [24] [25] (оценочные значения) | ? | 0 | 18 | 72 |
Graphcore Colossus GC200 Mk2 [26] (оценочные значения) | ? | 0 | 18 | 144 |
Суперкомпьютер | ||||
ENIAC @ 100 кГц, 385 флопов [27] | ||||
48-битный процессор @ 208 кГц в CDC 1604 в 1960 году | ||||
60-битный процессор @ 10 МГц в CDC6600 в 1964 году | 0,3 (FP60) | |||
60-битный процессор @ 10 МГц в CDC7600 в 1967 году | 1.0 (FP60) [28] | |||
Cray-1 @ 80 МГц в 1976 году | 2 | |||
CDC Cyber 205 @ 50 МГц в 1981 году | Компилятор FORTRAN (ANSI 77 с векторными расширениями) | 8 | 16 | |
Микроархитектура | ЭТО | FP64 | FP32 | FP16 |
Источник: [29]
Рекорды производительности
Записи на одном компьютере
В июне 1997 года Intel «s ASCI Red был первый в мире компьютер для достижения одного терафлопс и за ее пределами. Директор Sandia Билл Кэмп сказал, что ASCI Red обладает лучшей надежностью среди всех когда-либо построенных суперкомпьютеров и «является высшей точкой для суперкомпьютеров по долговечности, цене и производительности». [30]
NEC «S SX-9 суперкомпьютер был первым в мире векторного процессора превысит 100 гигафлопса за одно ядро.
В июне 2006 года новый компьютер был объявлен японским исследовательским институтом RIKEN , в MDGRAPE-3 . Производительность компьютера составляет один петафлопс, что почти в два раза быстрее, чем у Blue Gene / L, но MDGRAPE-3 не является компьютером общего назначения, поэтому его нет в списке Top500.org . Он имеет специальные конвейеры для моделирования молекулярной динамики.
К 2007 году корпорация Intel представила экспериментальный многоядерный чип POLARIS , обеспечивающий производительность в 1 терафлопс на частоте 3,13 ГГц. 80-ядерный чип может повысить этот результат до 2 терафлопс на частоте 6,26 ГГц, хотя тепловыделение на этой частоте превышает 190 Вт. [31]
В июне 2007 года Top500.org сообщил, что самым быстрым компьютером в мире стал суперкомпьютер IBM Blue Gene / L , максимальная скорость которого составила 596 терафлопс. [32] Cray XT4 ударил второе место с 101,7 Тфлопс.
26 июня 2007 года IBM анонсировала второе поколение своего топового суперкомпьютера, получившего название Blue Gene / P и разработанного для непрерывной работы на скоростях, превышающих один петафлопс, быстрее, чем Blue Gene / L. При такой настройке он может развивать скорость более трех петафлопс. [33]
25 октября 2007 года, NEC Corporation Японии выпустил пресс - релиз , объявляющий свою модель серии SX SX-9 , [34] , утверждая , что это самый быстрый в мире векторный суперкомпьютер. SX-9 показывает первый процессор , способный пиковая производительность вектора 102,4 гигафлопса на одном ядра.
4 февраля 2008 года Национальный научный фонд и Техасский университет в Остине открыл полномасштабных исследований пробегов на AMD , Sun суперкомпьютер под названием Ranger , [35] самая мощная система суперкомпьютеров в мире для открытых научных исследований, который работает на скорости устойчивого 0,5 петафлопс.
25 мая 2008 года американский суперкомпьютер « Roadrunner », построенный IBM , достиг вычислительного рубежа в один петафлопс. Он возглавил список TOP500 самых мощных суперкомпьютеров (без учета grid-компьютеров ) за июнь 2008 г. и ноябрь 2008 г. [36] [37] Компьютер находится в Лос-Аламосской национальной лаборатории в Нью-Мексико. Название компьютера относится к птице штата Нью-Мексико , большой дорожной бегуне ( Geococcyx californianus ). [38]
В июне 2008 года AMD выпустила серию ATI Radeon HD 4800, которые, как сообщается, станут первыми графическими процессорами, достигающими одного терафлопс. 12 августа 2008 года AMD выпустила видеокарту ATI Radeon HD 4870X2 с двумя графическими процессорами Radeon R770 общим объемом 2,4 терафлопс.
В ноябре 2008 года модернизация суперкомпьютера Cray Jaguar в Национальной лаборатории Окриджа (ORNL) Министерства энергетики (DOE) повысила вычислительную мощность системы до 1,64 петафлопс, что сделало Jaguar первой в мире системой с петафлопс, предназначенной для открытых исследований . В начале 2009 года суперкомпьютер был назван в честь мифического существа Кракен . Kraken был объявлен самым быстрым суперкомпьютером в мире, управляемым университетом, и шестым в рейтинге TOP500 2009 года. В 2010 году Kraken был модернизирован и теперь может работать быстрее и мощнее.
В 2009 году Cray Jaguar показал производительность 1,75 петафлопс, обойдя IBM Roadrunner и заняв первое место в списке TOP500 . [39]
В октябре 2010 года Китай представил Tianhe-1 , суперкомпьютер, работающий с максимальной вычислительной скоростью 2,5 петафлопс. [40] [41]
По состоянию на 2010 г.[Обновить]самый быстрый процессор ПК достиг 109 гигафлопс ( Intel Core i7 980 XE ) [42] в вычислениях с двойной точностью. Графические процессоры значительно мощнее. Например, вычислительные процессоры Nvidia Tesla C2050 GPU выполняют около 515 гигафлопс [43] в вычислениях с двойной точностью, а AMD FireStream 9270 достигает пика в 240 гигафлопс. [44]
В ноябре 2011 года было объявлено , что Япония достигла 10,51 петафлопс с К компьютеру . [45] Он имеет 88,128 SPARC64 VIIIfx процессоры в 864 стойках, с теоретической производительностью 11,28 петафлопс. Она названа в честь японского слова « кей », который стоит на 10 квадриллион , [46] , соответствующей целевой скорости 10 петафлопс.
15 ноября 2011 года Intel продемонстрировала единственный процессор на базе x86 под кодовым названием Knights Corner, выдерживающий более терафлопс в широком диапазоне операций DGEMM . Intel подчеркнула во время демонстрации, что это был устойчивый терафлопс (а не «сырой терафлопс», используемый другими для получения более высоких, но менее значимых чисел), и что это был первый процессор общего назначения, который когда-либо преодолевал терафлопс. [47] [48]
18 июня 2012 года суперкомпьютерная система IBM Sequoia , базирующаяся в Ливерморской национальной лаборатории США (LLNL), достигла 16 петафлопс, установив мировой рекорд и заняв первое место в последнем списке TOP500. [49]
12 ноября 2012 года рейтинг TOP500 подтвердил Titan как самый быстрый суперкомпьютер в мире согласно тесту LINPACK со скоростью 17,59 петафлопс. [50] [51] Он был разработан Cray Inc. в Национальной лаборатории Ок-Ридж и сочетает в себе процессоры AMD Opteron с технологиями графического процессора (GPU) NVIDIA Tesla «Kepler». [52] [53]
10 июня 2013 года китайский Tianhe-2 был признан самым быстрым в мире с показателем 33,86 петафлопс. [54]
20 июня 2016 года китайский Sunway TaihuLight был признан самым быстрым в мире с 93 петафлопс в тесте LINPACK (из 125 петафлопс). Система, которая почти полностью основана на технологии, разработанной в Китае, установлена в Национальном суперкомпьютерном центре в Уси и обеспечивает более высокую производительность, чем следующие пять самых мощных систем в списке TOP500 вместе взятые. [55]
В июне 2019 года Summit , суперкомпьютер IBM, который сейчас работает в Национальной лаборатории Ок-Ридж (ORNL) Министерства энергетики США, занял первое место с производительностью 148,6 петафлопс в тесте High Performance Linpack (HPL). используется для ранжирования списка TOP500. Summit имеет 4356 узлов, каждый из которых оснащен двумя 22-ядерными процессорами Power9 и шестью графическими процессорами NVIDIA Tesla V100. [56]
В июне 2020 года Fugaku показал результат High Performance Linpack (HPL) в 415,5 петафлопс , опередив систему Summit, которая теперь занимает второе место, в 2,8 раза. Fugaku работает на 48- ядерном процессоре Fujitsu A64FX SoC, став первой системой номер один в списке, оснащенной процессорами ARM. При одинарной или еще более низкой точности, используемой в приложениях машинного обучения и искусственного интеллекта, пиковая производительность Fugaku составляет более 1000 петафлопс (1 экзафлопс). Новая система установлена в Центре вычислительных наук RIKEN (R-CCS) в Кобе, Япония. [ необходима цитата ]
Записи распределенных вычислений
Распределенные вычисления используют Интернет, чтобы связать персональные компьютеры для достижения большего количества FLOPS:
- По состоянию на апрель 2020 г.[Обновить], То Folding @ домашняя сеть имеет более 2,3 exaFLOPS от общей вычислительной мощности. [57] [58] [59] [60] Это самая мощная распределенная компьютерная сеть, которая первой в истории превысила 1 эксафлопс общей вычислительной мощности. Такой уровень производительности в первую очередь достигается за счет совокупных усилий огромного количества мощных графических процессоров и процессоров . [61]
- По состоянию на декабрь 2020 г.[Обновить], вся сеть BOINC в среднем составляет около 31 петафлопса. [62]
- По состоянию на июнь 2018 г.[Обновить], SETI @ Home , применяя BOINC программной платформы, в среднем 896 терафлопс. [63]
- По состоянию на июнь 2018 г.[Обновить], Проект Einstein @ Home , использующий сеть BOINC , работает со скоростью 3 петафлопса. [64]
- По состоянию на июнь 2018 г.[Обновить], MilkyWay @ Home , используя BOINC инфраструктуры, вычисляет в 847 терафлопс. [65]
- По состоянию на июнь 2020 г.[Обновить], GIMPS , ищущий простые числа Мерсенна , выдерживает 1 354 терафлопс. [66]
Стоимость вычислений
Затраты на оборудование
Дата | Приблизительно доллар США за гигафлопс | Платформа, обеспечивающая самую низкую стоимость GFLOPS | Комментарии | |
---|---|---|---|---|
Не скорректировано | 2020 [67] | |||
1945 г. | 129,49 трлн долларов | $ 1881,79 трлн. | ENIAC : 487000 долларов в 1945 году и 7195000 долларов в 2019 году. | 487000 долл. США / 0,0000000385 GFLOPS |
1961 г. | 18,7 млрд долларов | 161,9 млрд долларов | Базовая установка IBM 7030 Stretch стоила в то время 7,78 миллиона долларов США каждая. | IBM 7030 Натяжные выполняет одну с плавающей точкой умножить каждые 2,4 микросекунды. [68] |
1984 | 18 750 000 долл. США | 46 710 000 долл. США | Крей X-MP / 48 | 15 000 000 долл. США / 0,8 GFLOPS |
1997 г. | 30 000 долл. США | 48 000 долл. США | Два 16-процессорных кластера Beowulf с микропроцессорами Pentium Pro [69] | |
Апрель 2000 г. | 1000 долларов США | 1 530 долл. США | Кластер Бунип Беовульф | Bunyip была первой вычислительной технологией стоимостью менее 1 доллара США за мегафлопс. В 2000 году он получил премию Гордона Белла. |
Май 2000 г. | 640 долл. США | 975 долл. США | KLAT2 | KLAT2 была первой вычислительной технологией, которая масштабировалась для крупных приложений, оставаясь при этом менее 1 доллара США за MFLOPS. [70] |
Август 2003 г. | 82 доллара США | 115 долларов США | KASY0 | KASY0 была первой вычислительной технологией стоимостью менее 100 долларов США за гигафлопс. [71] |
Август 2007 г. | 48 долларов США | 60 долларов США | Микровульф | По состоянию на август 2007 г., этот «персональный» кластер Beowulf со скоростью 26,25 GFLOPS может быть построен за 1256 долларов. [72] |
Март 2011 г. | 1,80 доллара США | 2,09 $ | HPU4Science | Этот кластер стоимостью 30 000 долл. США был построен с использованием только имеющегося в продаже оборудования «игрового» уровня. [73] |
Август 2012 г. | 0,75 доллара США | 0,85 долл. США | Система Quad AMD Radeon 7970 ГГц | Настольный компьютер с четырехъядерным процессором AMD Radeon 7970, обеспечивающий производительность вычислений одинарной точности 16 терафлопс и 4 терафлопс двойной точности. Общая стоимость системы составила 3000 долларов США; построен с использованием только имеющегося в продаже оборудования. [74] |
июнь 2013 | 0,22 доллара США | 0,24 доллара США | Sony PlayStation 4 | Пиковая производительность Sony PlayStation 4 составляет 1,84 терафлопс по цене 400 долларов [75]. |
Ноябрь 2013 | 0,16 доллара США | 0,18 доллара США | Система AMD Sempron 145 и GeForce GTX 760 | Система, построенная с использованием имеющихся в продаже компонентов, с использованием одного AMD Sempron 145 и трех Nvidia GeForce GTX 760 достигает в общей сложности 6,771 терафлопс при общей стоимости 1090,66 долларов США. [76] |
Декабрь 2013 | 0,12 доллара США | 0,13 доллара США | Система Pentium G550 и Radeon R9 290 | Построен с использованием имеющихся в продаже запчастей. Intel Pentium G550 и AMD Radeon R9 290 имеют максимальную производительность в 4,848 терафлопс и составляют 681,84 доллара США. [77] |
Январь 2015 | 0,08 доллара США | 0,09 доллара США | Система Celeron G1830 и Radeon R9 295X2 | Построен с использованием имеющихся в продаже запчастей. Intel Celeron G1830 и AMD Radeon R9 295X2 превысили 11,5 терафлопс при общей сумме 902,57 долларов США. [78] [79] |
Июнь 2017 г. | 0,06 доллара США | 0,06 доллара США | AMD Ryzen 7 1700 и AMD Radeon Vega Frontier Edition | Построен с использованием имеющихся в продаже запчастей. Процессор AMD Ryzen 7 1700 в сочетании с картами AMD Radeon Vega FE в CrossFire достигает максимальной производительности более 50 терафлопс по цене чуть менее 3000 долларов США за всю систему. [80] |
Октябрь 2017 г. | 0,03 доллара США | 0,03 доллара США | Intel Celeron G3930 и AMD RX Vega 64 | Построен с использованием имеющихся в продаже запчастей. Три видеокарты AMD RX Vega 64 обеспечивают половинную точность чуть более 75 TFLOPS (38 TFLOPS SP или 2,6 TFLOPS DP в сочетании с ЦП) при цене ~ 2050 долларов за всю систему. [81] |
Ноябрь 2020 | 0,03 доллара США | 0,03 доллара США | AMD Ryzen 3600 и 3 × NVIDIA RTX 3080 | AMD Ryzen 3600 @ 484 GFLOPS и 199,99 долларов США 3 × NVIDIA RTX 3080 @ 29770 Гфлопс каждый и 699,99 долларов США Общий объем GFLOPS = 89,794 / TFLOPS = 89,2794 Общая стоимость системы, вкл. реалистичные, но недорогие детали; соответствует другому примеру = 2839 долл. США [82] Долларов США / GFLOP = 0,0314 доллара США |
Ноябрь 2020 | 0,04 доллара США | 0,04 доллара США | PlayStation 5 | Цифровая версия Sony PlayStation 5 имеет пиковую производительность 10,28 терафлопс (20,58 терафлопс с половинной точностью) при розничной цене 399 долларов. [83] |
Смотрите также
- Производительность компьютера на порядки
- Приз Гордона Белла
- Тесты LINPACK
- Закон Мура
- Операция умножения-накопления
- Производительность на ватт # FLOPS на ватт
- SPECfp
- SPECint
- SUPS
- TOP500
Рекомендации
- ↑ Floating Point Проверено 25 декабря 2009 г.
- ^ Резюме: с фиксированной точкой (целое число) и с плавающей точкой по состоянию на 25 декабря 2009 г.
- ^ Фиксированный по сравнению с плавающей точкой. Проверено 25 декабря, 2009.
- ^ Обработка данных и математические вычисления. Проверено 25 декабря, 2009.
- ^ "Узлы, сокеты, ядра и FLOPS, о, мой" доктор Марк Р. Фернандес, доктор философии.
- ^ «ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ» . www.top500.org . Проверено 23 июня 2020 года .
- ^ а б "home.iae.nl" .
- ^ а б «Вычислительная мощность на протяжении всей истории» . www.alternatewars.com . Проверено 13 февраля 2021 года .
- ^ а б в г д Долбо, Ромен (2017). «Теоретический пик FLOPS на набор инструкций: учебное пособие». Журнал суперкомпьютеров . 74 (3): 1341–1377. DOI : 10.1007 / s11227-017-2177-5 .
- ^ «Поддержка новых инструкций для Bulldozer (FMA3) и Piledriver (FMA3 + 4 и CVT, BMI, TBM)» (PDF) .
- ^ «Блог о процессорах Агнера - Результаты тестирования AMD Ryzen» .
- ^ https://arstechnica.com/gadgets/2017/03/amds-moment-of-zen-finally-an-architecture-that-can-compete/2/ "каждое ядро теперь имеет пару 128-битных блоков FMA своего собственного "
- ^ Майк Кларк (23 августа 2016 г.). Новая архитектура ядра x86 для вычислений следующего поколения (PDF) . Горячие чипсы 28. AMD. стр.7
- ^ «Микроархитектура процессоров Intel и AMD» (PDF) .
- ^ «Основное выступление генерального директора AMD Лизы Су на выставке COMPUTEX 2019» . www.youtube.com .
- ^ «Развлекательные системы и высокопроизводительный процессор Ш-4» (PDF) . Обзор Hitachi . Hitachi . 48 (2): 58–63. 1999 . Проверено 21 июня 2019 года .
- ^ «Архитектура DSP нового поколения SH-4 для VoIP» (PDF) . Hitachi . 2000 . Проверено 21 июня 2019 года .
- ^ «Внутри Volta: самый продвинутый в мире графический процессор для центров обработки данных» .
- ^ «Подробнее об архитектуре NVIDIA Ampere» .
- ^ «NVIDIA A100» .
- ^ «Все навигаторы: Radeon RX 5700 XT - это RDNA с GDDR6» .
- ^ «AMD Radeon RX 5700 XT» .
- ^ «6 потоков на ядро означают, что IPC кратно 6, 1216 ядрам на чип» . www.youtube.com .
- ^ «250 TFLOPs / s для двух микросхем со смешанной точностью FP16» . www.youtube.com .
- ^ «Оценка по потребляемой мощности: FP32 составляет 1/4 от FP16, а тактовая частота ниже 1,5 ГГц» . www.youtube.com .
- ^ «Представляем системы Graphcore Mk2 IPU» . www.youtube.com .
- ^ "Компьютеры былых времен" . www.clear.rice.edu . Проверено 26 февраля 2021 года .
- ^ "CDC 7600" , Википедия , 16 сентября 2020 г. , получено 26 февраля 2021 г.
- ^ «Число операций с плавающей запятой в секунду (FLOPS)» .
- ^ «ASCI Red от Sandia, первый в мире суперкомпьютер с терафлопами, выведен из эксплуатации» (PDF) . Архивировано из оригинала (PDF) от 5 ноября 2010 года . Проверено 17 ноября 2011 года .
- ^ Ричард Суинберн (30 апреля 2007 г.). «Прибытие TeraFLOP Computing» . bit-tech.net . Проверено 9 февраля 2012 года .
- ^ «Выпущено 29-е место в списке самых быстрых суперкомпьютеров в мире TOP500» . Top500.org. 23 июня, 2007. Архивировано из оригинала 9 мая 2008 года . Проверено 8 июля 2008 года .
- ^ «Июнь 2008» . ТОП500 . Проверено 8 июля 2008 года .
- ^ «NEC запускает самый быстрый в мире векторный суперкомпьютер SX-9» . NEC. 25 октября 2007 . Проверено 8 июля 2008 года .
- ^ «Техасский университет в Остине, Техасский центр передовых вычислений» . Архивировано из оригинала на 1 августа 2009 года . Проверено 13 сентября 2010 года .
Любой исследователь в учреждении США может подать предложение о распределении циклов в системе.
- ^ Шэрон Годен (9 июня 2008 г.). «IBM Roadrunner преодолевает 4-минутную милю суперкомпьютеров» . Компьютерный мир. Архивировано из оригинального 24 декабря 2008 года . Проверено 10 июня 2008 года .
- ^ «Остин ISC08» . Top500.org. 14 ноября, 2008. Архивировано из оригинального 22 февраля 2012 года . Проверено 9 февраля 2012 года .
- ^ Филдс, Джонатан (9 июня 2008 г.). «Суперкомпьютер задает темп в петафлоп» . BBC News . Проверено 8 июля 2008 года .
- ^ Гринберг, Энди (16 ноября 2009 г.). "Cray Dethrones IBM в суперкомпьютерах" . Forbes .
- ^ «Китай претендует на корону суперкомпьютеров» . BBC News . 28 октября 2010 г.
- ^ Диллоу, Клэй (28 октября 2010 г.). «Китай представляет суперкомпьютер в 2507 петафлопс, самый быстрый в мире» . Popsci.com . Проверено 9 февраля 2012 года .
- ^ «Intel Core i7-980X Extreme Edition - готов к плохим результатам ?: Математика: Сандра Арифметика, шифрование, Microsoft Excel» . Techgage . 10 марта 2010 . Проверено 9 февраля 2012 года .
- ^ «Персональный суперкомпьютер NVIDIA Tesla» . Nvidia.com . Проверено 9 февраля 2012 года .
- ^ «Ускоритель вычислений AMD FireStream 9270 GPU» . Amd.com . Проверено 9 февраля 2012 года .
- ^ « „ K“компьютера Достигает цели 10 петафлопс» . Fujitsu.com . Проверено 9 февраля 2012 года .
- ^ См. Японские номера
- ^ «Уголок рыцарей Intel: сопроцессор 50+ Core, 22 нм» . 16 ноября 2011 . Проверено 16 ноября 2011 года .
- ^ «Intel представляет Knight's Corner со скоростью 1 терафлопс в секунду» . Проверено 16 ноября 2011 года .
- ^ Кларк, Дон (18 июня 2012 г.). «Компьютер IBM устанавливает рекорд скорости» . The Wall Street Journal . Проверено 18 июня 2012 года .
- ^ «BBC News - американский суперкомпьютер Titan стал самым быстрым в мире» . BBC News . Bbc.co.uk. 12 ноября 2012 . Проверено 28 февраля 2013 года .
- ^ "Oak Ridge претендует на позицию № 1 в последнем списке TOP500 с Titan | TOP500 суперкомпьютерных сайтов" . Top500.org. 12 ноября 2012 . Проверено 28 февраля 2013 года .
- ^ Монтальбано, Элизабет (11 октября 2011 г.). «Oak Ridge Labs создает самый быстрый суперкомпьютер» . Информационная неделя . Проверено 9 февраля 2012 года .
- ^ Тибкен, Шара (29 октября 2012 г.). «Суперкомпьютер Titan дебютирует для открытых научных исследований | Cutting Edge - CNET News» . News.cnet.com . Проверено 28 февраля 2013 года .
- ^ «Китайский суперкомпьютер стал самым быстрым в мире - во многом» . Журнал Forbes . 17 июня 2013 . Проверено 17 июня 2013 года .
- ^ Фельдман, Майкл. «Китай идет впереди в списке суперкомпьютеров TOP500, покончив с превосходством США» . TOP500.org . Проверено 31 декабря 2016 года .
- ^ «Июнь 2018 | ТОП500 суперкомпьютерных сайтов» . www.top500.org . Проверено 17 июля 2018 года .
- ^ «Folding @ Home Активные процессоры и графические процессоры по ОС» . www.foldingathome.org . Проверено 8 апреля 2020 года .
- ^ Складной @ home (25 марта 2020 г.). «Благодаря нашему УДИВИТЕЛЬНОМ сообществу мы преодолели барьер exaFLOP! Это более 1 000 000 000 000 000 000 операций в секунду, что делает нас примерно в 10 раз быстрее, чем IBM Summit! Pic.twitter.com/mPMnb4xdH3» . @foldingathome . Проверено 4 апреля 2020 года .
- ^ «Folding @ Home сокрушает Exascale Barrier, теперь быстрее, чем десятки суперкомпьютеров - ExtremeTech» . www.extremetech.com . Проверено 4 апреля 2020 года .
- ^ «Folding @ Home превышает 1,5 ExaFLOPS в битве с Covid-19» . TechSpot . Проверено 4 апреля 2020 года .
- ^ "Поддержка Sony Computer Entertainment для Folding @ Home проекта на PlayStation ™ 3 получает в этом году "Good Design Award Gold " " (пресс - релиз). Sony Computer Entertainment Inc. 6 ноября 2008. Архивировано из оригинала на 31 января 2009 года . Проверено 11 декабря 2008 года .
- ^ "Вычислительная мощность BOINC" . BOINC . Проверено 28 декабря 2020 года .
- ^ «Обзор SETI @ Home Credit» . BOINC . Проверено 15 июня 2018 года .
- ^ «Обзор Einstein @ Home Credit» . BOINC . Проверено 15 июня 2018 года .
- ^ «Обзор MilkyWay @ Home Credit» . BOINC . Проверено 15 июня 2018 года .
- ^ "Серверная технология распределенных вычислений Internet PrimeNet для большого поиска Мерсенн Прайм в Интернете" . GIMPS . Проверено 15 июня 2018 года .
- ^ С 1634 по 1699: Харрис, П. (1996). «Инфляция и дефляция в ранней Америке, 1634–1860: модели изменений в британской американской экономике». История социальных наук . 20 (4): 469–505. JSTOR 1171338 . 1700-1799: Маккаскер, Дж. Дж. (1992). Сколько это в реальных деньгах ?: исторический индекс цен для использования в качестве дефлятора денежной стоимости в экономике США (PDF) . Американское антикварное общество . 1800 – настоящее время: Федеральный резервный банк Миннеаполиса. «Индекс потребительских цен (оценка) 1800–» . Проверено 1 января 2020 года .
- ^ "IBM 7030 (РАСТЯЖКА)" . Норман Харди . Проверено 24 февраля 2017 года .
- ^ «Локи и Хиглак» . Loki-www.lanl.gov. 13 июля, 1997. Архивировано из оригинала 21 июля 2011 года . Проверено 9 февраля 2012 года .
- ^ «Кентукки Linux Athlon Testbed 2 (KLAT2)» . Агрегат . Проверено 9 февраля 2012 года .
- ^ «КАСЫ0» . Агрегат . 22 августа 2003 . Проверено 9 февраля 2012 года .
- ^ «Микровульф: персональный портативный кластер Беовульфа» . Архивировано из оригинального 12 сентября 2007 года . Проверено 9 февраля 2012 года .
- ^ Адам Стивенсон, Янн Ле Ду и Марием Эль Африт. « Высокопроизводительные вычисления на игровых ПК ». Ars Technica . 31 марта 2011 г.
- ^ Том Логан (9 января 2012 г.). «Обзор HD7970 Quadfire Eyefinity» . OC3D.net .
- ^ « Sony разжигает ценовую войну с PS4 по цене 399 долларов ». CNBC . 11 июня 2013 г.
- ^ «FreezePage» . Архивировано из оригинального 16 ноября 2013 года .
- ^ «FreezePage» . Архивировано из оригинального 19 декабря 2013 года .
- ^ «FreezePage» . Архивировано из оригинала на 10 января 2015 года.
- ^ «Обзор Radeon R9 295X2 8 ГБ: Project Hydra получает жидкостное охлаждение» . 8 апреля 2014 г.
- ^ Перес, Кэрол Э. (13 июля 2017 г.). «Создание блока глубокого обучения AMD Vega на 50 терафлопс менее чем за 3 тыс. Долларов» . Машина интуиции . Проверено 26 июля 2017 года .
- ^ "самый низкий _ $ / fp16 - список сохраненных деталей Mattebaughman - Celeron G3930 2,9 ГГц, двухъядерный, Radeon RX VEGA 64 8 ГБ (3-Way CrossFire), XON-350_BK ATX Mid Tower - PCPartPicker" . pcpartpicker.com . Проверено 13 сентября 2017 года .
- ^ «Системный строитель» . pcpartpicker.com . Проверено 7 декабря 2020 года .
- ^ [1] Проверено 12 мая, 2021.