计算机系统计算性能评价基于HPL的基准测试孟庆彬January21,2021背景05101520253035天河二号泰坦红杉京米拉33.8617.5917.1710.518.59超算Top500Rmax(TFlop/s)背景-top500•1993年,Linpack作为Top500排名依据•国际TOP500组织是发布全球已安装的超级计算机系统排名的权威机构,以超级计算机基准程序Linpack测试值为序进行排名,每年发布两次,其目的是促进国际超级计算机领域的交流和合作,促进超级计算机的推广应用。如何评价计算机的性能呢?•JackDongarra发表声明(Linpack标准的创始人)•计算机系统的Linkpack排名现在已经不能完全真实地反映应用程序的性能。•高度共轭梯度基准测试(HPCGPDFLink)性能评价•计算机性能o处理器主频、内存大小、内存总线带宽、I/O总线性能、显卡指标MemoryCPUOSNetwork,StorageApplication性能评测性能分析性能评价-基准测试•基准测试•没有一个标准能反映计算机系统的全部性能,它们代表的只是性能的一个侧面。•定点性能•浮点性能•WEB服务性能•数据处理性能•系统软件性能•科学与工程计算性能性能评价-基准测试•基准测试•没有一个标准能反映计算机系统的全部性能,它们代表的只是性能的一个侧面。•定点性能SPECint95,反映评测系统的单处理器的定点运算性能8个真实的应用:仿真技术、人工智能、图像处理、压缩算法、编译器、解释器、数据库用运行8个应用的标准时间,除以实际运行时间得到一个比值,SPEC_int95是这8个比值乘积的开8次方得到的值性能评价-基准测试•基准测试•没有一个标准能反映计算机系统的全部性能,它们代表的只是性能的一个侧面。•浮点性能SPECfp95评测系统的单处理器的浮点运算性能10个真实的应用:流体力学、天气预报、量子物理、天文、电子SPECfp_rate95反映具有多个处理器系统的浮点性能的可扩展性性能评价-基准测试•基准测试•没有一个标准能反映计算机系统的全部性能,它们代表的只是性能的一个侧面。•Web服务性能SPECweb96评价Web响应用户Web点击的性能SPECweb99评价了Web服务器综合性能性能评价-基准测试•基准测试•没有一个标准能反映计算机系统的全部性能,它们代表的只是性能的一个侧面。•数据处理性能TPC评测计算机系统进行事务处理和数据库操作的性能性能评价-基准测试•基准测试•没有一个标准能反映计算机系统的全部性能,它们代表的只是性能的一个侧面。•系统软件性能LmbenchSGI开发,测试操作系统性能Netperf评测计算机系统的网络性能性能评价-基准测试•基准测试•没有一个标准能反映计算机系统的全部性能,它们代表的只是性能的一个侧面。•科学与工程计算性能LinpackLINearalgebraPACKagesNASNumericalAerodynamicSimulationParkBench评价大型可扩展系统的计算性能HPL概念•Linpackobenchmark:最流行的测试高性能计算机系统浮点性能o方法:通过对高性能计算机采用高斯消元法求解一元N次稠密线性代数方程组的测试,评价高性能计算机的浮点性能。o测试类:Linpack100、Linpack1000和HPL•Linpack100求解规模为100阶的稠密线性代数方程组•Linpack1000要求求解1000阶的线性代数方程组•HPL:HighperformanceLinpack高度并行计算基准测试•HPLo针对现代并行计算机提出的测试方式HPL性能测试•HPLo实现:用户在不修改任意测试程序的基础上,可以调节问题规模大小N(矩阵大小)、使用CPU数目、使用各种优化方法等等来执行该测试程序,以获取最佳的性能。o求解问题规模为N时,浮点运算次数为23×𝑁3−2×𝑁2o测得系统计算时间To峰值=计算量(23×𝑁3−2×𝑁2)/计算时间To测试结果以浮点运算每秒(Flops)给出HPL安装配置•HPL安装(一准备阶段)oLinux平台,最新稳定内核的Linux发行版最佳,可以选择Redhat,Centos等。oMPICH2,这是个并行计算的软件oGotoblas,BLAS库(BasicLinearAlgebraSubprograms)是执行向量和矩阵运算的子程序集合oHPL,linpack测试的软件•HPL安装(二安装阶段)o安装MPICH2,并配置好环境变量o安装Gotoblas,生成libgoto2.a和libgoto2.so两个文件o安装HPL,并修改配置文件Make.arch文件,生成两个文件HPL.dat和xhplHPL安装配置•三优化阶段o算法相关的参数设置oCPU的架构数量和效率o内存容量o互联网络的通信性能o系统规模o算法相关的参数设置•四分析结果关于Benchmark•HPL的局限o计算机系统结构,GPU、MIC等协处理器对计算机的计算性能也起了比较大的作用o单一性,现在大量的HPC都是在求解偏微分方程,需要更高的带宽和更低的延迟,内存访问也更加不规则,细粒度的迭代•HPCCo作为HPL的补充,包含了HPL,PTRANS,STREAM,RandomAceess,DGEMM,FFT,Lantency-BandWidth七类测试•HPCGo使用局部对称Gauss-Seidel预条件子的预处理共轭梯度法谢谢!