HPC Challenge Benchmark - HPC Challenge Benchmark

HPC Challenge Benchmark
Ursprüngliche Autor (en)	Innovatives Computerlabor, Universität von Tennessee
Erstveröffentlichung	2003
Stabile Version	1.5.0 / 18. März 2016 ; vor 5 Jahren
Plattform	Plattformübergreifend
Lizenz	BSD
Webseite	icl .cs .utk .edu / hpcc /

HPC Challenge Benchmark kombiniert mehrere Benchmarks , um eine Reihe unabhängiger Attribute für die Leistung von HPC-Systemen ( High Performance Computer ) zu testen . Das Projekt wurde vom DARPA- Programm für Hochproduktivitäts-Computersysteme , dem US-Energieministerium und der National Science Foundation mitgesponsert .

Kontext

Die Leistung komplexer Anwendungen auf HPC-Systemen kann von einer Vielzahl unabhängiger Leistungsattribute der Hardware abhängen. Der HPC Challenge Benchmark ist ein Versuch, die Sichtbarkeit dieses mehrdimensionalen Raums zu verbessern, indem die Messung mehrerer dieser Attribute in einem einzigen Programm kombiniert wird.

Obwohl die interessierenden Leistungsattribute nicht spezifisch für eine bestimmte Computerarchitektur sind, wird bei der Referenzimplementierung des HPC Challenge Benchmark in C und MPI davon ausgegangen , dass das zu testende System ein Cluster von Multiprozessorsystemen mit gemeinsamem Speicher ist , die über ein Netzwerk verbunden sind . Aufgrund dieser Annahme einer hierarchischen Systemstruktur werden die meisten Tests in verschiedenen Betriebsarten ausgeführt. Nach der in den Benchmark-Berichten verwendeten Notation bedeuten die mit "einzeln" gekennzeichneten Ergebnisse, dass der Test auf einem zufällig ausgewählten Prozessor im System ausgeführt wurde. Die mit "Stern" gekennzeichneten Ergebnisse bedeuten, dass auf jedem Prozessor im System gleichzeitig eine unabhängige Kopie des Tests ausgeführt wurde System und mit "global" gekennzeichnete Ergebnisse bedeuten, dass alle Prozessoren koordiniert an der Lösung eines einzelnen Problems arbeiteten (mit Daten, die auf die Knoten des Systems verteilt waren).

Komponenten

Der Benchmark besteht derzeit aus 7 Tests (mit den jeweils angegebenen Betriebsarten):

HPL (High Performance LINPACK ) - Misst die Leistung eines Lösers für ein dichtes lineares Gleichungssystem (global).
DGEMM - misst die Leistung für die Matrix-Matrix-Multiplikation (Einzel, Stern).
STREAM - Misst die anhaltende Speicherbandbreite zum / vom Speicher (einzeln, sternförmig).
PTRANS - Misst die Rate, mit der das System ein großes Array (global) transponieren kann .
RandomAccess - Misst die Rate von 64-Bit-Aktualisierungen für zufällig ausgewählte Elemente einer großen Tabelle (einzeln, sternförmig, global).
FFT - führt eine schnelle Fourier-Transformation an einem großen eindimensionalen Vektor unter Verwendung des verallgemeinerten Cooley-Tukey- Algorithmus (einzeln, sternförmig, global) durch.
Kommunikationsbandbreite und Latenz - MPI-zentrierte Leistungsmessungen basierend auf dem Benchmark für Bandbreite / Latenz von b_eff.

Leistungsattribute

Auf hoher Ebene sollen die Tests vier wichtige Leistungsmerkmale abdecken: Gleitkomma-Arithmetik mit doppelter Genauigkeit (DGEMM und HPL), lokale Speicherbandbreite (STREAM), Netzwerkbandbreite für "große" Nachrichten (PTRANS, RandomAccess) , FFT, b_eff) und Netzwerkbandbreite für "kleine" Nachrichten (RandomAccess, b_eff). Einige der Codes sind komplexer als andere und können zusätzliche Leistungsempfindlichkeiten aufweisen. In einigen Systemen kann die HPL-Leistung beispielsweise durch die Netzwerkbandbreite und / oder die Netzwerklatenz begrenzt sein.

Wettbewerb

Der jährliche HPC Challenge Award-Wettbewerb auf der Supercomputing-Konferenz konzentriert sich auf vier der herausforderndsten Benchmarks in der Suite:

Globales HPL
Global RandomAccess (ODER BSS Random Access Benchmark )
EP STREAM (Triad) pro System
Globale FFT

Es gibt zwei Klassen von Auszeichnungen:

Klasse 1 : Beste Leistung auf Basisbasis oder optimierter Lauf, eingereicht auf der HPC Challenge-Website.
Klasse 2 : Die "eleganteste" Implementierung von vier oder fünf Rechenkernen, einschließlich drei oder mehr der HPC Challenge-Benchmarks.

Siehe auch

Referenzort

Verweise

^ "Releases · icl-utk-edu / hpcc" . github.com . Abgerufen am 2021-04-12 .
^ "Cray X1 Supercomputer hat die höchsten gemeldeten Ergebnisse bei von der Regierung gesponserten HPC Challenge Benchmark-Tests" . 2004-06-14. Archiviert vom Original am 04.05.2012 . Abgerufen am 22.01.2010 . CS1-Wartung: entmutigter Parameter ( Link )
^ "HPL - Eine tragbare Implementierung des Hochleistungs-Linpack-Benchmarks für Computer mit verteiltem Speicher" . Innovatives Computerlabor, Universität von Tennessee in Knoxville . Abgerufen am 10.06.2015 . CS1-Wartung: entmutigter Parameter ( Link )
^ "STREAM: Nachhaltige Speicherbandbreite in Hochleistungscomputern" . Abgerufen am 10.06.2015 . CS1-Wartung: entmutigter Parameter ( Link )
^ "Benchmark für effektive Bandbreite (b_eff)" . Hochleistungsrechenzentrum Stuttgart . Abgerufen am 10.06.2015 . CS1-Wartung: entmutigter Parameter ( Link )
^ Der Benchmark wurde entwickelt, um das Ersetzen eines begrenzten Satzes von Funktionen durch höher optimierte Versionen zu ermöglichen und gleichzeitig ein "Basis" -Lauf zu bleiben. Zusätzliche (aber immer noch begrenzte) Änderungen sind in der Kategorie "optimierte" Läufe zulässig.
^ "HPC Challenge Award Wettbewerb" . DARPA HPCS-Programm . Abgerufen am 23.01.2010 . CS1-Wartung: entmutigter Parameter ( Link )

Externe Links

Offizielle HPC Challenge Benchmark-Website
Offizielle Website des HPC Challenge Award-Wettbewerbs
BSS Random Access Benchmark Leistungsbewertung und Optimierung des zufälligen Speicherzugriffs auf Multicores mit hoher Produktivität (Best Paper Award) auf der ACM / IEEE HiPC 2010

[1] "Releases · icl-utk-edu / hpcc" . github.com . Abgerufen am 2021-04-12 .

[2] "Cray X1 Supercomputer hat die höchsten gemeldeten Ergebnisse bei von der Regierung gesponserten HPC Challenge Benchmark-Tests" . 2004-06-14. Archiviert vom Original am 04.05.2012 . Abgerufen am 22.01.2010 . CS1-Wartung: entmutigter Parameter ( Link )

[3] "HPL - Eine tragbare Implementierung des Hochleistungs-Linpack-Benchmarks für Computer mit verteiltem Speicher" . Innovatives Computerlabor, Universität von Tennessee in Knoxville . Abgerufen am 10.06.2015 . CS1-Wartung: entmutigter Parameter ( Link )

[4] "STREAM: Nachhaltige Speicherbandbreite in Hochleistungscomputern" . Abgerufen am 10.06.2015 . CS1-Wartung: entmutigter Parameter ( Link )

[5] "Benchmark für effektive Bandbreite (b_eff)" . Hochleistungsrechenzentrum Stuttgart . Abgerufen am 10.06.2015 . CS1-Wartung: entmutigter Parameter ( Link )

[6] Der Benchmark wurde entwickelt, um das Ersetzen eines begrenzten Satzes von Funktionen durch höher optimierte Versionen zu ermöglichen und gleichzeitig ein "Basis" -Lauf zu bleiben. Zusätzliche (aber immer noch begrenzte) Änderungen sind in der Kategorie "optimierte" Läufe zulässig.

[7] "HPC Challenge Award Wettbewerb" . DARPA HPCS-Programm . Abgerufen am 23.01.2010 . CS1-Wartung: entmutigter Parameter ( Link )

Languages

In other projects