Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

HPC Challenge Benchmark объединяет несколько тестов для тестирования ряда независимых атрибутов производительности высокопроизводительных компьютерных систем (HPC). Спонсорами проекта выступили программа DARPA High Productivity Computing Systems , Министерство энергетики США и Национальный научный фонд . [1]

Контекст [ править ]

Производительность сложных приложений в системах HPC может зависеть от множества независимых характеристик производительности оборудования. Тест HPC Challenge Benchmark - это попытка улучшить видимость этого многомерного пространства за счет объединения измерений нескольких из этих атрибутов в одной программе.

Хотя производительность атрибутов интерес не являются специфическими для какой - либо конкретной архитектуры компьютера, ссылка реализация HPC Challenge Benchmark в C и MPI предполагает , что тестируемая система представляет собой кластер из общих многопроцессорных памяти систем , соединенных сетью. Из-за этого предположения об иерархической структуре системы большинство тестов выполняется в нескольких различных режимах работы. После обозначения, используемого в отчетах о тестах, результаты, помеченные как «одиночный», означают, что тест проводился на одном случайно выбранном процессоре в системе, результаты, помеченные «звездочкой», означают, что независимая копия теста выполнялась одновременно на каждом процессоре система, а результаты, помеченные как «глобальные», означают, что все процессоры работали согласованно для решения одной проблемы (с данными, распределенными по узлам системы).

Компоненты [ править ]

В настоящий момент бенчмарк состоит из 7 тестов (для каждого указаны режимы работы):

  1. HPL [2] (High Performance LINPACK ) - измеряет производительность решателя для плотной системы линейных уравнений (глобально).
  2. DGEMM - измеряет производительность при умножении матрицы на матрицу (одиночное, звездообразное).
  3. STREAM [3] - измеряет постоянную пропускную способность памяти в / из памяти (одиночный, звездочка).
  4. PTRANS - измеряет скорость, с которой система может транспонировать большой массив (глобальный).
  5. RandomAccess - измеряет скорость 64-битных обновлений случайно выбранных элементов большой таблицы (одиночной, звездообразной, глобальной).
  6. БПФ - выполняет быстрое преобразование Фурье для большого одномерного вектора с использованием обобщенного алгоритма Кули – Тьюки (одиночный, звездообразный, глобальный).
  7. Пропускная способность и задержка связи - MPI-ориентированные измерения производительности на основе теста полосы пропускания / задержки b_eff [4] .

Атрибуты производительности [ править ]

На высоком уровне тесты предназначены для охвата четырех важных атрибутов производительности: арифметики с плавающей запятой двойной точности (DGEMM и HPL), пропускной способности локальной памяти (STREAM), пропускной способности сети для «больших» сообщений (PTRANS, RandomAccess , FFT, b_eff) и пропускной способности сети для «маленьких» сообщений (RandomAccess, b_eff). Некоторые коды более сложные, чем другие, и могут иметь дополнительную чувствительность к производительности. Например, в некоторых системах производительность HPL может быть ограничена пропускной способностью сети и / или задержкой в ​​сети.

Конкурс [ править ]

Ежегодный конкурс HPC Challenge Award на Supercomputing Conference посвящен четырем из самых сложных тестов в пакете:

Есть два класса наград:

  • Класс 1 : Лучшая производительность на базовом или оптимизированном прогоне, представленном на веб-сайте HPC Challenge. [5]
  • Класс 2 : Наиболее "элегантная" реализация четырех или пяти вычислительных ядер, включая три или более тестов HPC Challenge. [6]

См. Также [ править ]

Ссылки [ править ]

  1. ^ «Суперкомпьютер Cray X1 имеет самые высокие результаты тестов HPC Challenge, спонсируемых государством» . 2004-06-14. Архивировано из оригинала на 2012-05-04 . Проверено 22 января 2010 .
  2. ^ «HPL - портативная реализация высокопроизводительного теста Linpack для компьютеров с распределенной памятью» . Лаборатория инновационных вычислений, Университет Теннесси в Ноксвилле . Проверено 10 июня 2015 .
  3. ^ «ПОТОК: Устойчивая пропускная способность памяти в высокопроизводительных компьютерах» . Проверено 10 июня 2015 .
  4. ^ «Эффективная пропускная способность (b_eff) Benchmark» . Центр высокопроизводительных вычислений в Штутгарте . Проверено 10 июня 2015 .
  5. ^ Тест предназначен для замены ограниченного набора функций более оптимизированными версиями, оставаясь при этом «базовым» прогоном. Дополнительные (но все же ограниченные) модификации разрешены в категории «оптимизированных» запусков.
  6. ^ «Конкурс награды HPC Challenge» . Программа DARPA HPCS . Проверено 23 января 2010 .

Внешние ссылки [ править ]

  • Официальный веб-сайт HPC Challenge Benchmark
  • Официальный веб-сайт конкурса HPC Challenge Award
  • Оценка производительности BSS Random Access Benchmark и оптимизация произвольного доступа к памяти на многоядерных компьютерах с высокой производительностью (награда за лучшую работу) на ACM / IEEE HiPC 2010