Автор (ы) оригинала | Лаборатория инновационных вычислений, Университет Теннесси |
---|---|
Начальная версия | 2003 г. |
Стабильный выпуск | 1.5.0a |
Платформа | Кроссплатформенность |
Лицензия | BSD |
Веб-сайт | http://icl.cs.utk.edu/hpcc/ |
HPC Challenge Benchmark объединяет несколько тестов для тестирования ряда независимых атрибутов производительности высокопроизводительных компьютерных систем (HPC). Спонсорами проекта выступили программа DARPA High Productivity Computing Systems , Министерство энергетики США и Национальный научный фонд . [1]
Контекст [ править ]
Производительность сложных приложений в системах HPC может зависеть от множества независимых характеристик производительности оборудования. Тест HPC Challenge Benchmark - это попытка улучшить видимость этого многомерного пространства за счет объединения измерений нескольких из этих атрибутов в одной программе.
Хотя производительность атрибутов интерес не являются специфическими для какой - либо конкретной архитектуры компьютера, ссылка реализация HPC Challenge Benchmark в C и MPI предполагает , что тестируемая система представляет собой кластер из общих многопроцессорных памяти систем , соединенных сетью. Из-за этого предположения об иерархической структуре системы большинство тестов выполняется в нескольких различных режимах работы. После обозначения, используемого в отчетах о тестах, результаты, помеченные как «одиночный», означают, что тест проводился на одном случайно выбранном процессоре в системе, результаты, помеченные «звездочкой», означают, что независимая копия теста выполнялась одновременно на каждом процессоре система, а результаты, помеченные как «глобальные», означают, что все процессоры работали согласованно для решения одной проблемы (с данными, распределенными по узлам системы).
Компоненты [ править ]
В настоящий момент бенчмарк состоит из 7 тестов (для каждого указаны режимы работы):
- HPL [2] (High Performance LINPACK ) - измеряет производительность решателя для плотной системы линейных уравнений (глобально).
- DGEMM - измеряет производительность при умножении матрицы на матрицу (одиночное, звездообразное).
- STREAM [3] - измеряет постоянную пропускную способность памяти в / из памяти (одиночный, звездочка).
- PTRANS - измеряет скорость, с которой система может транспонировать большой массив (глобальный).
- RandomAccess - измеряет скорость 64-битных обновлений случайно выбранных элементов большой таблицы (одиночной, звездообразной, глобальной).
- БПФ - выполняет быстрое преобразование Фурье для большого одномерного вектора с использованием обобщенного алгоритма Кули – Тьюки (одиночный, звездообразный, глобальный).
- Пропускная способность и задержка связи - MPI-ориентированные измерения производительности на основе теста полосы пропускания / задержки b_eff [4] .
Атрибуты производительности [ править ]
На высоком уровне тесты предназначены для охвата четырех важных атрибутов производительности: арифметики с плавающей запятой двойной точности (DGEMM и HPL), пропускной способности локальной памяти (STREAM), пропускной способности сети для «больших» сообщений (PTRANS, RandomAccess , FFT, b_eff) и пропускной способности сети для «маленьких» сообщений (RandomAccess, b_eff). Некоторые коды более сложные, чем другие, и могут иметь дополнительную чувствительность к производительности. Например, в некоторых системах производительность HPL может быть ограничена пропускной способностью сети и / или задержкой в сети.
Конкурс [ править ]
Ежегодный конкурс HPC Challenge Award на Supercomputing Conference посвящен четырем из самых сложных тестов в пакете:
- Глобальный HPL
- Global RandomAccess (OR BSS Random Access Benchmark )
- EP STREAM (Триада) на систему
- Глобальное БПФ
Есть два класса наград:
- Класс 1 : Лучшая производительность на базовом или оптимизированном прогоне, представленном на веб-сайте HPC Challenge. [5]
- Класс 2 : Наиболее "элегантная" реализация четырех или пяти вычислительных ядер, включая три или более тестов HPC Challenge. [6]
См. Также [ править ]
Ссылки [ править ]
- ^ «Суперкомпьютер Cray X1 имеет самые высокие результаты тестов HPC Challenge, спонсируемых государством» . 2004-06-14. Архивировано из оригинала на 2012-05-04 . Проверено 22 января 2010 .
- ^ «HPL - портативная реализация высокопроизводительного теста Linpack для компьютеров с распределенной памятью» . Лаборатория инновационных вычислений, Университет Теннесси в Ноксвилле . Проверено 10 июня 2015 .
- ^ «ПОТОК: Устойчивая пропускная способность памяти в высокопроизводительных компьютерах» . Проверено 10 июня 2015 .
- ^ «Эффективная пропускная способность (b_eff) Benchmark» . Центр высокопроизводительных вычислений в Штутгарте . Проверено 10 июня 2015 .
- ^ Тест предназначен для замены ограниченного набора функций более оптимизированными версиями, оставаясь при этом «базовым» прогоном. Дополнительные (но все же ограниченные) модификации разрешены в категории «оптимизированных» запусков.
- ^ «Конкурс награды HPC Challenge» . Программа DARPA HPCS . Проверено 23 января 2010 .
Внешние ссылки [ править ]
- Официальный веб-сайт HPC Challenge Benchmark
- Официальный веб-сайт конкурса HPC Challenge Award
- Оценка производительности BSS Random Access Benchmark и оптимизация произвольного доступа к памяти на многоядерных компьютерах с высокой производительностью (награда за лучшую работу) на ACM / IEEE HiPC 2010