HPC Challenge Benchmark
Originalförfattare | Innovative Computing Laboratory, University of Tennessee |
---|---|
Initial release | 2003 |
Stabil frisättning | 1.5.0 / 18 mars 2016
|
Plattform | Cross-plattform |
Licens | BSD |
Hemsida |
HPC Challenge Benchmark kombinerar flera benchmarks för att testa ett antal oberoende attribut för prestanda hos högpresterande datorsystem (HPC). Projektet har samsponsrats av DARPA High Productivity Computing Systems- programmet, United States Department of Energy och National Science Foundation .
Sammanhang
Prestandan hos komplexa applikationer på HPC-system kan bero på en mängd olika oberoende prestandaattribut hos hårdvaran. HPC Challenge Benchmark är ett försök att förbättra synligheten i detta flerdimensionella utrymme genom att kombinera mätningen av flera av dessa attribut i ett enda program.
Även om prestandaattributen av intresse inte är specifika för någon speciell datorarkitektur, antar referensimplementeringen av HPC Challenge Benchmark i C och MPI att systemet som testas är ett kluster av multiprocessorsystem med delat minne som är anslutna till ett nätverk . På grund av detta antagande om en hierarkisk systemstruktur körs de flesta testerna i flera olika driftsätt. Efter notationen som används av benchmark-rapporterna betyder resultat märkta "enkel" att testet kördes på en slumpmässigt vald processor i systemet, resultat märkta med "stjärna" betyder att en oberoende kopia av testet kördes samtidigt på varje processor i system, och resultat märkta "global" betyder att alla processorer arbetade i samordning för att lösa ett enda problem (med data fördelade över systemets noder).
Komponenter
Riktmärket består för närvarande av 7 tester (med de funktionssätt som anges för varje):
- HPL (High Performance LINPACK ) – mäter prestanda hos en lösare för ett tätt system av linjära ekvationer (globalt).
- DGEMM – mäter prestanda för matris-matrismultiplikation (enkel, stjärna).
- STREAM – mäter ihållande minnesbandbredd till/från minne (enkel, stjärna).
- PTRANS – mäter den hastighet med vilken systemet kan transponera en stor array (global).
- RandomAccess – mäter hastigheten för 64-bitars uppdateringar av slumpmässigt valda element i en stor tabell (enkel, stjärna, global).
- FFT – utför en snabb Fourier-transform på en stor endimensionell vektor med hjälp av den generaliserade Cooley-Tukey- algoritmen (enkel, stjärna, global).
- Kommunikationsbandbredd och latens – MPI-centrerade prestandamätningar baserade på b_eff-riktmärket för bandbredd/latens.
Prestandaattribut
På en hög nivå är testerna avsedda att ge täckning av fyra viktiga prestandaattribut: aritmetik med dubbel precision med flyttal (DGEMM och HPL), lokal minnesbandbredd (STREAM), nätverksbandbredd för "stora" meddelanden (PTRANS, RandomAccess , FFT, b_eff) och nätverksbandbredd för "små" meddelanden (RandomAccess, b_eff). Vissa av koderna är mer komplexa än andra och kan ha ytterligare prestandakänsligheter. Till exempel kan HPL-prestanda i vissa system begränsas av nätverksbandbredd och/eller nätverkslatens.
Konkurrens
Den årliga HPC Challenge Award-tävlingen vid Supercomputing Conference fokuserar på fyra av de mest utmanande riktmärkena i sviten:
- Global HPL
- Global RandomAccess (ELLER BSS Random Access Benchmark )
- EP STREAM (Triad) per system
- Global FFT
Det finns två klasser av utmärkelser:
- Klass 1 : Bästa prestanda på en bas eller optimerad körning som skickats till HPC Challenge-webbplatsen.
- Klass 2 : Mest "eleganta" implementering av fyra eller fem beräkningskärnor inklusive tre eller fler av HPC Challenge-riktmärkena.
Se även
- ^ "Releaser · icl-utk-edu/hpcc" . github.com . Hämtad 2021-04-12 .
- ^ "Cray X1 superdator har högsta rapporterade poäng på regeringssponsrade HPC Challenge Benchmark-test" . 2004-06-14. Arkiverad från originalet 2009-03-30 . Hämtad 2010-01-22 .
- ^ "HPL - En bärbar implementering av det högpresterande Linpack-riktmärket för datorer med distribuerat minne" . Innovative Computing Laboratory, University of Tennessee i Knoxville . Hämtad 2015-06-10 .
- ^ "STRÖM: Hållbar minnesbandbredd i högpresterande datorer" . Hämtad 2015-06-10 .
- ^ "Effektiv bandbredd (b_eff) Benchmark" . High Performance Computing Center Stuttgart . Hämtad 2015-06-10 .
- ^ Benchmarken är utformad för att tillåta ersättning av en begränsad uppsättning funktioner med mer högoptimerade versioner samtidigt som den förblir en "baskörning". Ytterligare (men fortfarande begränsade) ändringar är tillåtna under kategorin "optimerade" körningar.
- ^ "HPC Challenge Award Competition" . DARPA HPCS-program . Hämtad 2010-01-23 .
externa länkar
- HPC Challenge Benchmark officiella webbplats
- HPC Challenge Award Competition officiella webbplats
- BSS Random Access Benchmark Performance Evaluation och optimering av Random Memory Access på flera kärnor med hög produktivitet (Best Paper Award) vid ACM/IEEE HiPC 2010