惠普企业 (HPE) 推出了新的超级计算解决方案,旨在为 AI 语言和多模式模型训练等密集型工作负载提供动力,并具有创新的冷却功能。
为了帮助客户加速研究和创新工作,HPE推出了由Nvidia和AMD等公司的 GPU 驱动的新型超级计算服务器,以及旨在帮助用户更轻松地运行密集型工作负载的软件。
该产品组合基于 HPE 最近推出的无风扇直接液体冷却系统架构,该公司声称与混合直接液体冷却相比,该系统可将每个服务器刀片的冷却功率降低 37%。
该产品组合的高端产品是两款新的 Cray EX 解决方案,即 EX4252 和 EX154n,每款产品都采用了来自竞争对手芯片设计公司的加速器。
EX4252 是一个单机架单元,配备八个 AMD 全新第五代 EPYC 处理器,能够在单个机柜中提供多达 98,304 个内核。
同时,EX154n 的设计可在单个机柜中容纳多达 224 个Nvidia Blackwell GPU。HPE表示,该机采用 Nvidia 的 GB200 Grace Blackwell 超级芯片,旨在“大幅缩短完成超级计算工作负载所需的时间”。
EX4252 将于 2025 年春季上市,而由于 Nvidia 致力于提高 Blackwell 的产量,客户将不得不等到 2025 年底才能获得 EX154n 。
HPE 还推出了 Slingshot Interconnect 400,旨在提供比上一代产品高出两倍的线路速度,同时还提供自动拥塞管理和自适应路由等功能,以实现超低尾部延迟 - 使用户能够以更少的网络基础设施运行大量工作负载。
Cray 超级计算机产品组合的另一项扩展包括增加了存储系统 E2000,这是一种专为大型超级计算机设计的高性能存储系统。HPE 声称,与存储解决方案相比,E2000 的输入/输出 (I/O) 性能提高了一倍以上,通过减少 I/O 操作期间的空闲时间,可以更好地利用基于 CPU 和 GPU 的计算节点。
E200 将于 2025 年初上市,Slingshot 互连 400 将于秋季晚些时候发布。
HPE还推出了一款新软件,旨在帮助用户在运行计算密集型工作负载时获得更好的体验。
HPE Cray 超级计算用户服务软件旨在帮助客户优化系统效率、调节功耗并在其超级计算基础设施解决方案组合上灵活运行各种工作负载。
支持超级计算解决方案的是两款专为支持AI工作负载而设计的新型 HPE 服务器。
ProLiant Compute XD680 服务器可以为 AI 训练、调整和推理工作负载提供支持,其机箱仅在一个节点中就容纳了八个英特尔 Gaudi 3 AI 加速器。
同时,ProLiant Compute XD685 服务器旨在加速大型复杂 AI 模型的训练。HPE 的一份声明称,XD685 配备 Nvidia H200 或 Blackwell GPU,采用五机架机箱,适合“优先考虑性能、竞争优势和能源效率”的用户。
XD680 将于 2024 年 12 月上市,而搭载 H200 动力的 XD685 将于 2025 年初推出,Blackwell 版本将在稍后上市。
不过,搭载 AMD Instinct MI325Xs的 XD685 服务器版本将于 2025 年第一季度上市。
HPE HPC 和 AI 基础设施解决方案高级副总裁兼总经理 Trish Damkroger 表示:“我们的客户希望我们能够加快 AI 系统的部署,通过利用我们世界领先的 HPC 解决方案以及数十年交付、部署和维护完全集成系统的经验,更快、更高效地实现价值。”
【公司名称】四川旭辉星创科技有限公司
【代理级别】成都惠普HPE服务器工作站
【销售经理】熊经理
【联系方式】座机:028-85596747 手机:18244236404
【公司地址】成都市人民南路 科华路口 群益商务大厦403
请用微信扫描二维码