Тест HPC Challenge - HPC Challenge Benchmark

Тест HPC Challenge
Оригинальный автор (ы)Лаборатория инновационных вычислений, Университет Теннесси
изначальный выпуск2003 (2003)
Стабильный выпуск
1.5.0a
ПлатформаКроссплатформенность
ЛицензияBSD
Интернет сайтhttp://icl.cs.utk.edu/hpcc/

Тест HPC Challenge объединяет несколько ориентиры для проверки ряда независимых атрибутов производительности высокопроизводительных компьютер (HPC) системы. Спонсором проекта является DARPA Вычислительные системы высокой производительности программа, Министерство энергетики США и Национальный фонд науки.[1]

Контекст

Производительность сложных приложений в системах HPC может зависеть от множества независимых характеристик производительности оборудования. Тест HPC Challenge Benchmark - это попытка улучшить наглядность этого многомерного пространства за счет объединения измерений нескольких из этих атрибутов в одной программе.

Хотя интересующие нас характеристики производительности не относятся к какой-либо конкретной компьютерной архитектуре, эталонная реализация теста HPC Challenge Benchmark в C и MPI предполагает, что тестируемая система является кластер из мультипроцессор с общей памятью системы, соединенные сеть. Из-за этого предположения об иерархической структуре системы большинство тестов выполняется в нескольких различных режимах работы. В соответствии с обозначениями, используемыми в отчетах о тестах, результаты, помеченные как «одиночный», означают, что тест проводился на одном случайно выбранном процессоре в системе, результаты, помеченные «звездочкой», означают, что независимая копия теста выполнялась одновременно на каждом процессоре в системе. системы, а результаты, помеченные как «глобальные», означают, что все процессоры работали согласованно для решения одной проблемы (с данными, распределенными по узлам системы).

Составные части

На данный момент бенчмарк состоит из 7 тестов (для каждого указаны режимы работы):

  1. HPL[2] (Высокая производительность LINPACK ) - измеряет производительность решателя для плотной система линейных уравнений (Глобальный).
  2. DGEMM - измеряет производительность при умножении матрицы на матрицу (одиночное, звездообразное).
  3. ТРАНСЛИРОВАТЬ[3] - меры выдержаны пропускная способность памяти в / из памяти (одиночный, звездный).
  4. PTRANS - измеряет скорость, с которой система может транспонировать большой массив (глобальный).
  5. RandomAccess - измеряет скорость 64-битных обновлений случайно выбранных элементов большой таблицы (одиночной, звездообразной, глобальной).
  6. БПФ - выполняет Быстрое преобразование Фурье на большом одномерном векторе с помощью обобщенного Кули – Тьюки алгоритм (одиночный, звездный, глобальный).
  7. Пропускная способность и задержка связи - MPI-ориентированные измерения производительности на основе b_eff[4] Тест пропускной способности / задержки.

Характеристики производительности

На высоком уровне тесты предназначены для охвата четырех важных атрибутов производительности: арифметики с плавающей запятой двойной точности (DGEMM и HPL), пропускной способности локальной памяти (STREAM), пропускной способности сети для «больших» сообщений (PTRANS, RandomAccess , FFT, b_eff) и пропускной способности сети для «маленьких» сообщений (RandomAccess, b_eff). Некоторые коды более сложные, чем другие, и могут иметь дополнительную чувствительность к производительности. Например, в некоторых системах производительность HPL может быть ограничена пропускной способностью сети и / или задержкой в ​​сети.

Конкуренция

Ежегодный Конкурс на приз HPC Challenge на Конференция по суперкомпьютерам фокусируется на четырех самых сложных тестах в пакете:

Есть два класса наград:

  • 1 класс: Лучшая производительность для базового или оптимизированного прогона, представленного на веб-сайте HPC Challenge.[5]
  • 2 класс: Самая «элегантная» реализация четырех или пяти вычислительных ядер, включая три или более тестов HPC Challenge.[6]

Смотрите также

Рекомендации

  1. ^ «Суперкомпьютер Cray X1 имеет самые высокие результаты в тестах производительности HPC Challenge, спонсируемых государством». 2004-06-14. Архивировано из оригинал на 2012-05-04. Получено 2010-01-22.
  2. ^ «HPL - переносимая реализация высокопроизводительного теста Linpack для компьютеров с распределенной памятью». Лаборатория инновационных вычислений, Университет Теннесси в Ноксвилле. Получено 2015-06-10.
  3. ^ "STREAM: стабильная пропускная способность памяти в высокопроизводительных компьютерах". Получено 2015-06-10.
  4. ^ «Контрольный показатель эффективной пропускной способности (b_eff)». Центр высокопроизводительных вычислений Штутгарт. Получено 2015-06-10.
  5. ^ Тест предназначен для замены ограниченного набора функций более оптимизированными версиями, оставаясь при этом «базовым» прогоном. Дополнительные (но все же ограниченные) модификации разрешены в категории «оптимизированных» запусков.
  6. ^ «Конкурс на приз HPC Challenge». Программа DARPA HPCS. Получено 2010-01-23.

внешняя ссылка