2023-12-07 17:11:46
来 源
中存储
通用服务器
SPEChpc_2021_tny_base、SPEChpc_2021_tny_peak、SPEChpc_2021_sml_base 和 SPEChpc_2021_sml_peak 指标创造了 20 项新的 2 插槽性能世界纪录。

ThinkSystem SR675 V3 凭借新的 SPEChpc 2021 基准测试结果创下 20 项世界纪录

联想 ThinkSystem SR675 V3 凭借 SPEChpc 2021 基准测试的 SPEChpc_2021_tny_base、SPEChpc_2021_tny_peak、SPEChpc_2021_sml_base 和 SPEChpc_2021_sml_peak 指标创造了 20 项新的 2 插槽性能世界纪录。

这些新的基准测试结果发表在 2023 年 11 月 1 日的新 SPEC 报告中,表明 ThinkSystem SR675 V3 以出色的服务器性能延续了联想的领导地位。

SR675 V3 使用 OpenACC 作为节点级并行化模型,取得了 1 节点、2 插槽、1 GPU base 和峰值得分的最佳成绩,具体如下:

SPEChpc_2021_tny_base = 17.7
SPEChpc_2021_tny_peak = 17.9
SR675 V3 使用 OpenACC 作为节点级并行化模型,取得了最好的 1 节点、2 插槽、2 GPU 基础和峰值得分,如下所示:

SPEChpc_2021_tny_base = 32.3
SPEChpc_2021_tny_peak = 32.6
SR675 V3 使用 OpenACC 作为节点级并行化模型,取得了最好的 1 节点、2 插槽、3 GPU 基础和峰值得分,具体如下:

SPEChpc_2021_tny_base = 45.7
SPEChpc_2021_tny_peak = 46.1
SR675 V3 使用 OpenACC 作为节点级并行化模型,取得了 1 节点、2 插槽、4 GPU 基础和峰值的最佳得分,具体如下:

SPEChpc_2021_tny_base = 57.8
SPEChpc_2021_tny_peak = 58.3
SR675 V3 使用 OpenACC 作为节点级并行化模型,取得了 1 节点、2 插槽、5 GPU 基础和峰值的最佳得分,具体如下:

SPEChpc_2021_tny_base = 58.9
SPEChpc_2021_tny_peak = 59.3
SR675 V3 使用 OpenACC 作为节点级并行化模型,取得了 1 节点、2 插槽、6 GPU 基础和峰值的最佳得分,具体如下:

SPEChpc_2021_tny_base = 68.7
SPEChpc_2021_tny_peak = 69.3
SR675 V3 使用 OpenACC 作为节点级并行化模型,取得了最好的 1 个节点、插槽、7 个 GPU 基础和峰值得分,具体如下:

SPEChpc_2021_tny_base = 69.2
SPEChpc_2021_tny_peak = 69.4
SR675 V3 使用 OpenACC 作为节点级并行化模型,取得了 1 节点、2 插槽、8 GPU 基础和峰值得分的最佳成绩,具体如下:

SPEChpc_2021_tny_base = 79.9
SPEChpc_2021_tny_peak = 80.4
SR675 V3 使用 OpenACC 作为节点级并行化模型,取得了最佳的 1 节点、Base 和 Peak ACC 分数,如下所示:

SPEChpc_2021_tny_base = 79.9
SPEChpc_2021_tny_peak = 80.4
SR675 V3 使用 OpenACC 作为节点级并行化模型,取得了 1 节点、2 插槽、7 GPU 基础和峰值的最佳得分,具体如下:

SPEChpc_2021_sml_base = 11
SPEChpc_2021_sml_peak = 11.1

SPEChpc 2021 Benchmark 套件是评估基于硬件的加速器设备和并行计算工作负载性能的行业标准。为了支持异构系统架构,SPEChpc 2021 基准测试支持多种编程模型:

  • 纯 MPI
  • MPI+OpenMP
  • MPI+OpenACC
  • MPI+OpenMP 与目标卸载

MPI+OpenMP 通过根据 NUMA 架构正确配置基于 CPU 的系统,可以减少 SPEChpc 2021 某些子基准测试中的通信需求和内存消耗,从而提高性能。

ThinkSystem SR675 V3 服务器配置如下:

  • 2 个 AMD EPYC 9654 处理器(96 核,2.40 GHz)
  • 768 GB 内存(24 个 32GB RDIMM,频率为 4800MHz)
  • 8 个 NVIDIA H100 PCIe 80GB GPU
  • 红帽企业 Linux 8.6

结果截至 2023 年 11 月 1 日,具体测试结果链接:

SPEChpc using the OpenACC model 1 node, 2 socket, 1 GPU base and peak:
https://spec.org/hpc2021/results/res2023q4/hpc2021-20230822-00248.html

SPEChpc using the OpenACC model 1 node, 2 socket, 2 GPU base and peak:
https://spec.org/hpc2021/results/res2023q4/hpc2021-20230822-00247.html

SPEChpc using the OpenACC model 1 node, 2 socket, 3 GPU base and peak:
https://spec.org/hpc2021/results/res2023q4/hpc2021-20230822-00246.html

SPEChpc using the OpenACC model 1 node, 2 socket, 4 GPU base and peak:
https://spec.org/hpc2021/results/res2023q4/hpc2021-20230822-00245.html

SPEChpc using the OpenACC model 1 node, 2 socket, 5 GPU base and peak:
https://spec.org/hpc2021/results/res2023q4/hpc2021-20230822-00244.html

SPEChpc using the OpenACC model 1 node, 2 socket, 6 GPU base and peak:
https://spec.org/hpc2021/results/res2023q4/hpc2021-20230822-00243.html

SPEChpc using the OpenACC model 1 node, 2 socket, 7 GPU base and peak:
https://spec.org/hpc2021/results/res2023q4/hpc2021-20230822-00242.html

SPEChpc using the OpenACC model 1 node, 2 socket, 8 GPU base and peak and 1-node, base and peak ACC:
https://spec.org/hpc2021/results/res2023q4/hpc2021-20230822-00241.html

SPEChpc using the OpenACC model 1 node, 2 socket, 7 GPU base and peak Small:
https://spec.org/hpc2021/results/res2023q4/hpc2021-20230905-00256.html

To view all SPEChpc 2021 results, go to
https://spec.org/hpc2021/results/

关于 ThinkSystem SR675 V3
联想 ThinkSystem SR675 V3 是一款功能强大且用途广泛的服务器,旨在满足现代数据中心环境的需求。该服务器为各行各业的人工智能 (AI)、高性能计算 (HPC) 和图形工作负载提供最佳性能。SR675 V3 是一款多功能 GPU 丰富的 3U 机架式服务器,支持 8 个双宽 GPU,包括新的 NVIDIA H100 和 L40S Tensor Core GPU,或具有 NVLink 和联想 Neptune 混合液-气冷却的 NVIDIA HGX H100 4-GPU 产品。

该服务器基于新的 AMD EPYC 9004 系列处理器(原代号为“Genoa”、“Genoa-X”和“Bergamo”),具有多达 160 个 PCIe 通道和高达 3TB 的最新 DDR5 内存。使用具有热插拔功能的 SAS/SATA 和 NVMe 的多个驱动器选项以及 XClarity 系统管理软件,可以轻松快速地进行更改。多功能设计不会止步于存储;SR675 V3 支持 GPU 和 PCIe 的多个选项,以满足图形、速度和预算要求。

关于SPEChpc 2021
高性能计算 (HPC) 系统的构建具有更高的异构性。多种类型的加速器带来了巨大的额外计算能力,同时也给性能评估和表征带来了巨大的挑战。当开发了多个并行和加速器编程模型时,每个模型仅支持计算设备的子集,这会增加问题的复杂性。

SPEChpc 2021 基准测试套件通过提供一组应用程序基准测试套件来解决这些挑战,这些套件使用对先进 HPC 系统的实际性能进行全面测量。它们提供精心挑选的科学和工程代码,这些代码代表了 HPC 工作负载,并且可以在 CPU 和加速器之间移植,以及某些公平的比较性能指标。

SPEChpc 2021 侧重于跨一个或多个节点的计算密集型并行性能,这意味着这些基准测试强调以下组件的性能:

  • 处理器和 GPU - CPU 芯片和可选的加速设备,如 GPU
  • 内存 - 内存层次结构,包括缓存和主内存
  • 互连 - 集群节点之间的通信
  • 编译器 - C、C++ 和 Fortran 编译器,包括优化器
  • MPI - MPI 实现。

SPEChpc 2021 基准测试套件分为四个工作负载:小型、小型、中型和大型:

  • SPEChpc2021 微型工作负载使用高达 60 GB 的内存,旨在使用 1 到 256 个列的单个节点上使用。
  • SPEChpc2021 小型工作负载使用高达 480 GB 的内存,旨在使用 64 到 1024 个列的一个或多个节点上使用
  • SPEChpc2021 中型工作负载使用高达 4 TB 的内存,适用于使用 256 到 4096 列的中型集群
  • SPEChpc2021 大型工作负载使用高达 14.5 TB 的内存,旨在用于使用 2048 到 32,768 个列的大型集群

价格

ThinkSystem SR675 V3 凭借新的 SPEChpc 2021 基准测试结果创下 20 项世界纪录

来源:Lenovo官网

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。