HPC Challenge Benchmark

HPC Challenge Benchmark
Originalförfattare	Innovative Computing Laboratory, University of Tennessee
Initial release	2003
Stabil frisättning	1.5.0 / 18 mars 2016 ; för 6 år sedan
Plattform	Cross-plattform
Licens	BSD
Hemsida	icl .cs .utk .edu /hpcc /

HPC Challenge Benchmark kombinerar flera benchmarks för att testa ett antal oberoende attribut för prestanda hos högpresterande datorsystem (HPC). Projektet har samsponsrats av DARPA High Productivity Computing Systems- programmet, United States Department of Energy och National Science Foundation .

Sammanhang

Prestandan hos komplexa applikationer på HPC-system kan bero på en mängd olika oberoende prestandaattribut hos hårdvaran. HPC Challenge Benchmark är ett försök att förbättra synligheten i detta flerdimensionella utrymme genom att kombinera mätningen av flera av dessa attribut i ett enda program.

Även om prestandaattributen av intresse inte är specifika för någon speciell datorarkitektur, antar referensimplementeringen av HPC Challenge Benchmark i C och MPI att systemet som testas är ett kluster av multiprocessorsystem med delat minne som är anslutna till ett nätverk . På grund av detta antagande om en hierarkisk systemstruktur körs de flesta testerna i flera olika driftsätt. Efter notationen som används av benchmark-rapporterna betyder resultat märkta "enkel" att testet kördes på en slumpmässigt vald processor i systemet, resultat märkta med "stjärna" betyder att en oberoende kopia av testet kördes samtidigt på varje processor i system, och resultat märkta "global" betyder att alla processorer arbetade i samordning för att lösa ett enda problem (med data fördelade över systemets noder).

Komponenter

Riktmärket består för närvarande av 7 tester (med de funktionssätt som anges för varje):

HPL (High Performance LINPACK ) – mäter prestanda hos en lösare för ett tätt system av linjära ekvationer (globalt).
DGEMM – mäter prestanda för matris-matrismultiplikation (enkel, stjärna).
STREAM – mäter ihållande minnesbandbredd till/från minne (enkel, stjärna).
PTRANS – mäter den hastighet med vilken systemet kan transponera en stor array (global).
RandomAccess – mäter hastigheten för 64-bitars uppdateringar av slumpmässigt valda element i en stor tabell (enkel, stjärna, global).
FFT – utför en snabb Fourier-transform på en stor endimensionell vektor med hjälp av den generaliserade Cooley-Tukey- algoritmen (enkel, stjärna, global).
Kommunikationsbandbredd och latens – MPI-centrerade prestandamätningar baserade på b_eff-riktmärket för bandbredd/latens.

Prestandaattribut

På en hög nivå är testerna avsedda att ge täckning av fyra viktiga prestandaattribut: aritmetik med dubbel precision med flyttal (DGEMM och HPL), lokal minnesbandbredd (STREAM), nätverksbandbredd för "stora" meddelanden (PTRANS, RandomAccess , FFT, b_eff) och nätverksbandbredd för "små" meddelanden (RandomAccess, b_eff). Vissa av koderna är mer komplexa än andra och kan ha ytterligare prestandakänsligheter. Till exempel kan HPL-prestanda i vissa system begränsas av nätverksbandbredd och/eller nätverkslatens.

Konkurrens

Den årliga HPC Challenge Award-tävlingen vid Supercomputing Conference fokuserar på fyra av de mest utmanande riktmärkena i sviten:

Global HPL
Global RandomAccess (ELLER BSS Random Access Benchmark )
EP STREAM (Triad) per system
Global FFT

Det finns två klasser av utmärkelser:

Klass 1 : Bästa prestanda på en bas eller optimerad körning som skickats till HPC Challenge-webbplatsen.
Klass 2 : Mest "eleganta" implementering av fyra eller fem beräkningskärnor inklusive tre eller fler av HPC Challenge-riktmärkena.

Se även

Referensplats

^ "Releaser · icl-utk-edu/hpcc" . github.com . Hämtad 2021-04-12 .
^ "Cray X1 superdator har högsta rapporterade poäng på regeringssponsrade HPC Challenge Benchmark-test" . 2004-06-14. Arkiverad från originalet 2009-03-30 . Hämtad 2010-01-22 .
^ "HPL - En bärbar implementering av det högpresterande Linpack-riktmärket för datorer med distribuerat minne" . Innovative Computing Laboratory, University of Tennessee i Knoxville . Hämtad 2015-06-10 .
^ "STRÖM: Hållbar minnesbandbredd i högpresterande datorer" . Hämtad 2015-06-10 .
^ "Effektiv bandbredd (b_eff) Benchmark" . High Performance Computing Center Stuttgart . Hämtad 2015-06-10 .
^ Benchmarken är utformad för att tillåta ersättning av en begränsad uppsättning funktioner med mer högoptimerade versioner samtidigt som den förblir en "baskörning". Ytterligare (men fortfarande begränsade) ändringar är tillåtna under kategorin "optimerade" körningar.
^ "HPC Challenge Award Competition" . DARPA HPCS-program . Hämtad 2010-01-23 .

externa länkar

HPC Challenge Benchmark officiella webbplats
HPC Challenge Award Competition officiella webbplats
BSS Random Access Benchmark Performance Evaluation och optimering av Random Memory Access på flera kärnor med hög produktivitet (Best Paper Award) vid ACM/IEEE HiPC 2010

[1] "Releaser · icl-utk-edu/hpcc" . github.com . Hämtad 2021-04-12 .

[2] "Cray X1 superdator har högsta rapporterade poäng på regeringssponsrade HPC Challenge Benchmark-test" . 2004-06-14. Arkiverad från originalet 2009-03-30 . Hämtad 2010-01-22 .

[3] "HPL - En bärbar implementering av det högpresterande Linpack-riktmärket för datorer med distribuerat minne" . Innovative Computing Laboratory, University of Tennessee i Knoxville . Hämtad 2015-06-10 .

[4] "STRÖM: Hållbar minnesbandbredd i högpresterande datorer" . Hämtad 2015-06-10 .

[5] "Effektiv bandbredd (b_eff) Benchmark" . High Performance Computing Center Stuttgart . Hämtad 2015-06-10 .

[6] Benchmarken är utformad för att tillåta ersättning av en begränsad uppsättning funktioner med mer högoptimerade versioner samtidigt som den förblir en "baskörning". Ytterligare (men fortfarande begränsade) ändringar är tillåtna under kategorin "optimerade" körningar.

[7] "HPC Challenge Award Competition" . DARPA HPCS-program . Hämtad 2010-01-23 .