生成式AI、LLM的爆发式发展推进了智能技术在千行百业的深入应用,加速计算成为了IT基础设施的增长动力,尤其是AI服务器、CXL、HBM等产品或技术的不断迭代提供的优异性能,让人们看到了其更为广阔的市场机遇。EVOC Adam Server G952N6是亿万克设计的一款搭载英特尔第三代至强可扩展系列处理器的4U10GPU卡双路异构计算服务器,适用于互联网、IDC(互联网数据中心)云计算、大数据、高校、人工智能以及高性能计算等业务,可以满足数据规模大、应用算力高、灵活弹性等场景需求。
从外观来看,亿万克Adam Server G952N6采用了简洁素雅的设计风格,易于安装、拆卸、维护,这款为4U 19英寸机架式服务器,机身净重60.35KG,尺寸为840mm(长)*460mm(宽)*175mm(高),前面板辨识度的logo标识与亿万克橙色线条彰显大厂气质。
EVOC Adam Server G952N6
前面板右上角则提供了2个USB 3.2和1个VGA接口、左上角则是1个UID按钮/指示灯、1个RST按钮,以及1个电源开关按钮/指示灯、1个健康状态灯、1个硬盘指示灯和2个LAN指示灯,可以让使用者一目了然。
同时,亿万克G952N6具备12个3.5英寸热插拔硬盘的盘位,可以支持4个U.2NVMe硬盘,能充分满足生成式AI、HPC、大数据分析等应用数据的存储需求。
EVOC Adam Server G952N6
亿万克G952N6主板配有2个M.2接口用于系统盘,最多提供13个PCIe扩展槽,可以满足客户各种扩展需求,最大支持10个全高全长双宽300W GPU加速卡,适用于深度学习,大数据分析等应用。板载提供了1个IPMI专用GbE,以及一个OCP 3.0接口,灵活选配。
在使用运维上,可以通过BMC Web管理界面、故障诊断LED等查看设备的运行状态,通过挂耳的UID指示灯标记故障的机器,快速定位故障器件,及时解决问题,简化维护工作,提高系统可用性。此外,亿万克G952N6服务器集成了智能散热管理系统,可以根据整机运行状态智能调节散热模式,提高设备能效比,为客户节约电力成本。
亿万克G952N6服务器具体参数配置如下所示:
亿万克G952N6服务器参数配置
从以上相关配置方面所得,这款服务器单个CPU最高拥有40个内核及80线程,最大TDP 270W,最高主频3.6GHz,3组11.2 GT/s UPI互连链路,可搭配英特尔C621A服务器芯片组和32根DDR4 3200 MTS内存,同时还支持16根BPA PMEM类型内存,有效提升了内存容量。
在测试环节,我们对亿万克G952N6服务器的外观结构进行了初步检测,分别检测板载丝印、OCP槽丝印、串口丝印、硬盘灯丝印、PCIE槽位、电源灯/开关丝印等细节,做工精致,丝印清晰,不愧是大厂品质。
随后我们对服务器面板、OS安装、CPU功能、内存功能、PCH SATA盘、RAID/HBA卡SATA/SAS盘/NVME盘、PCIE U.2 NVMe盘或板载M.2 NVMe盘、GPU功能、PCIE槽位、板载网口、VGA接口、串口、USB接口、电源接口、风扇接口、OCP槽等多项进行了基本功能测试,所有测试项表现出色全部通过。
例如测试PCIE槽位时,跑PCIE卡的压力测试10分钟,dmesg和bmc sel没有错误信息,PCIE卡无异常,开关机和重启机器15次,均能正常识别PCIE卡,表现优秀。
测试配置表
进入性能测试环节,我们分别对CPU性能、内存性能、硬盘性能、显卡性能进行了全面测试。
首先我们对CPU进行性能测试,借助Linpack测试程序,通过计算双精度线性方程组的求解来测试CPU的运算能力。测试结果显示,实测数值优于理论数值,较好的浮点运算性能让该服务器在工程应用或编程环境中有优异的表现,如物理学的实验模拟或是计算机编程中的数值计算等应用场景。
CPU性能测试
我们在G952N6服务器内存测试中,选择了STREAM(v5.10版本)和MLC(v3.9版本)2个工具进行测试,其中,STREAM是主流的内存带宽测试程序,该程序对CPU的计算能力要求很小,对CPU内存带宽压力较大,测试可以得到可持续运行的内存带宽最大值,而非所谓的理论值,主要使用四种数组运算,包括数组的复制(Copy)、数组的尺度变换(Scale)、数组的矢量求和(Add)、数组的复合适量求和(Triad)测试内存带宽性能,数组的值采用双精度。
内存性能测试
通常来说,应用程序从处理器缓存或内存子系统获取数据时会存在各种延迟,再加上内存带宽的能力,对应用的性能表现造成了影响,MLC就可以对此进行测试。例如,查询内存访问延迟指令的结果,可以表示node之间/内部的空闲内存访问延迟矩阵,以ns为单位。
内存性能测试
内存性能测试
从内存测试结果来看,普遍高于官网理论值的表现,不仅可以应对数据查询、应用、调用等常见的任务,还可以在现流行的高性能计算等应用中发挥更大的作用。在机型配置中可以看到,ECC内存可以实现错误检查和纠正,这很大程度上保障了系统整体的安全性和稳定性,能最大限度的降低缺陷率,而RDIMM内存则可以降低时延,适用于大容量、高速率、实时性的应用场景,另外在LRDIMM的帮助下,由于在数据总线上使用了缓冲器,可以减少系统内存控制器的电负载,让服务器内存总线能够达到更高的工作频率,大幅提升内存所支持的容量。
在硬盘性能测试中,我们对SAS盘、NVMe盘以及SATA盘进行了测试,使用的是FIO(v3.15版本)软件,FIO(Flexible I/O Tester)是一款专业用于测试磁盘、文件系统、块设备和网络设备性能的工具,可以模拟不同类型的I/O负载,包括随机或顺序读写、混合读写、随机或顺序访问等,并且可以对测试进行高度定制化配置,使得整机对硬盘性能的支撑得到全面的展示。
SAS盘顺序读写测试
SAS盘RAID测试
SAS盘随机读写测试
NVMe盘顺序读写测试
NVMe盘随机读写测试
SATA盘顺序读写测试
SATA盘随机读写测试
SATA盘RAID测试
亿万克G952N6服务器提供了SAS、SATA、NVMe三种硬盘选择,使得该机型可以满足各种复杂的数据存储需求和备份。经过我们测试后发现,硬盘的实际表现优于官网理论值,如NVMe盘的高性能、低延迟的特性,可以充分利用PCIe的高带宽能力,提供更高的数据传输速率和IOPS,满足大数据处理和高性能计算等场景,而SAS硬盘较好的表现则在RAID方面提供了较高的数据保护和应对故障的能力。
我们使用CUDA工具针对GPU进行测试,CUDA是一个高性能并行计算平台,允许开发者使用C/C++、Fortran等编程语言在英伟达GPU上进行并行计算,提供了强大的计算能力和高效的数据传输方式,使得GPU在科学计算、机器学习、深度学习等领域得到了广泛应用。CUDA-Z是一款用于查询显卡信息,测试显卡性能的工具,可以对英伟达GPU进行专业测试,也是我们这次选用的测试软件(CUDA-Z 10.251)。
CUDA-Z FP32测试
CUDA-Z FP64测试
从测试数据所得,显卡性能的实测数值优于官网理论值,以FP32和FP64为例,前者是多数深度学习框架默认采用的精度,可以在保证一定计算精度的同时提供较快的计算速度,单精度浮点性能较高,可以更好的满足3D图形处理需求,比如工程建模设计等任务,双精度浮点数FP64的高数值可以满足精确的科学计算,比如分子建模、流体动力学等场景。
此外,我们还对机器功耗进行了测试,结果所示,亿万克G952N6服务器开机最大功耗为3224 W,系统下空载功耗为823 W,系统下50%负载功耗(系统下运行PTU+FIO+gpu_burn让CPU、内存、NVMe盘/硬盘跑到50%,10分钟)为3365 W,系统下最大功耗(系统下运行YES+DD让CPU、内存、NVMe盘/硬盘跑到100%,10分钟)为3652 W,这款服务器拥有较好的性能表现同时,功耗控制和节能表现也非常值得称赞。
总结:
通过上述测试,亿万克Adam Server G952N6服务器在处理器与内存性能方便的表现十分不俗,处理高并发、大规模数据时的多核多线程能力应对业务高峰游刃有余。PCIe的扩展能力可以在任意场景中满足当前火热的AI需求,能够将GPU的潜力充分发挥,为深度学习、大数据分析等应用带来澎拜效能,并配合NVMe等多种硬盘形态的支持,可以更好的满足互联网、AI、云计算等业务场景下的各种复杂需求,例如大规模的复杂数据存储、资源弹性扩展、高性能计算等,从综合表现来看,亿万克Adam Server G952N6是一款面向云和AI时代的颇具竞争力的产品。
企业客户采购需求调研
部件 | 具体参数 |
机型 | 4U 19英寸机架式 |
处理器 | 支持2 颗第三代智能英特尔® 至强® 可扩展处理器 |
芯片组 | Intel C621A芯片组 |
内存 | 支持32个DDR4 内存插槽,共16个通道,最高支持3200MHz ECC LRDIMM/RDIMM |
存储支持 | 前置:12个3.5\"或2.5\" 硬盘 4个2.5\" NVME硬盘(可选) |
PCI-E扩展 | 最大支持13个PCIe 4.0扩展 |
GPU扩展 | 最大支持10块全高全长PCIe4.0 x16 TDP 300W GPU |
BMC功能 | 支持IPMI、SNMP、Redfish协议的统一管理接口 |
接口&指示灯 | 前置:2个USB3.2,1个VGA接口,1个COM口,1个UID按钮/指示灯,1个RST按钮,1个电源开关按钮/指示灯,1个健康状态灯,1个硬盘指示灯,2个LAN指示灯 后置:2个USB3.2,1个IPMI RJ45接口 |
系统风扇 | 标配热插拔冗余风扇 |
电源 | 支持1600W/2000W热插拔3+1冗余白金电源 |
工作温度 | 工作时5℃~35℃ |
OS | Microsoft Windows Server CentOS Red Hat Enterprise Linux SUSE Linux Enterprise Server Ubuntu |
部件 | 具体参数 |
机型 | 4U 19英寸机架式 |
处理器 | 支持2 颗第三代智能英特尔® 至强® 可扩展处理器 |
芯片组 | Intel C621A芯片组 |
内存 | 支持32个DDR4 内存插槽,共16个通道,最高支持3200MHz ECC LRDIMM/RDIMM |
存储支持 | 前置:12个3.5\"或2.5\" 硬盘 4个2.5\" NVME硬盘(可选) |
PCI-E扩展 | 最大支持13个PCIe 4.0扩展 |
GPU扩展 | 最大支持10块全高全长PCIe4.0 x16 TDP 300W GPU |
BMC功能 | 支持IPMI、SNMP、Redfish协议的统一管理接口 |
接口&指示灯 | 前置:2个USB3.2,1个VGA接口,1个COM口,1个UID按钮/指示灯,1个RST按钮,1个电源开关按钮/指示灯,1个健康状态灯,1个硬盘指示灯,2个LAN指示灯 后置:2个USB3.2,1个IPMI RJ45接口 |
系统风扇 | 标配热插拔冗余风扇 |
电源 | 支持1600W/2000W热插拔3+1冗余白金电源 |
工作温度 | 工作时5℃~35℃ |
OS | Microsoft Windows Server CentOS Red Hat Enterprise Linux SUSE Linux Enterprise Server Ubuntu |
部件 | 具体参数 |
机型 | 4U 19英寸机架式 |
处理器 | 支持2 颗第三代智能英特尔® 至强® 可扩展处理器 |
芯片组 | Intel C621A芯片组 |
内存 | 支持32个DDR4 内存插槽,共16个通道,最高支持3200MHz ECC LRDIMM/RDIMM |
存储支持 | 前置:12个3.5\"或2.5\" 硬盘 4个2.5\" NVME硬盘(可选) |
PCI-E扩展 | 最大支持13个PCIe 4.0扩展 |
GPU扩展 | 最大支持10块全高全长PCIe4.0 x16 TDP 300W GPU |
BMC功能 | 支持IPMI、SNMP、Redfish协议的统一管理接口 |
接口&指示灯 | 前置:2个USB3.2,1个VGA接口,1个COM口,1个UID按钮/指示灯,1个RST按钮,1个电源开关按钮/指示灯,1个健康状态灯,1个硬盘指示灯,2个LAN指示灯 后置:2个USB3.2,1个IPMI RJ45接口 |
系统风扇 | 标配热插拔冗余风扇 |
电源 | 支持1600W/2000W热插拔3+1冗余白金电源 |
(8326488)