舜网新闻 >

济南超算携手华为 研发成果登顶全球

舜网-济南日报

2025-08-10 07:10:44

  本报8月9日讯(记者 李小梦 通讯员:王昱岩)近日,全球权威AI性能评测组织公布最新的MLP-erf®Storagev2.0基准测试结果,其中,由国家超级计算济南中心与华为技术有限公司协同研发优化的高性能存储系统,在3项核心性能指标上刷新世界纪录,位列全球第一。

  该存储系统刷新世界纪录的3项核心性能涉及传输速度、传输通道、单通道承载能力。其中,在3DU-Net训练测试中,该系统单台存储设备的数据传输速度高达每秒698GiB/s,相当于1秒钟传完近700部高清电影;单位机架空间的传输能力达到每秒108GiB/s,在同一个机架上的所有计算单元可以同时满速获取所需数据,数据传输多通道并行,不需排队等待;单个客户端的传输速度突破每秒104GiB/s,即便是一台计算设备单独工作,也能享受到全球最快的数据供应速度。这3项核心指标全部位列世界第一,使我国在大规模AI训练的数据吞吐领域迈入国际领先行列。“简单来说,这套系统就像是AI‘超级大脑’的‘数据高速公路’,负责把海量训练数据不间断地输送到成百上千张‘计算显卡’中进行学习,加快AI学习速度。”国家超级计算济南中心主任王英龙介绍。

  除了“跑得快”之外,这套系统还解决了一个长期困扰大模型训练的“瓶颈”——断点续训,也就是AI学习中途“存档”和“读档”的问题。

  “过去存档就像长途旅行中汽车加油,如果加油慢、油枪少,所有车辆都得排长队,浪费大量时间。而在AI大模型训练中,这个过程叫‘随时保存训练进度、以便中断后快速恢复’。”王英龙说,“该系统攻克了这一性能瓶颈——在Llama3_70B模型训练测试中,单客户端的读写速度分别达到68.8GiB/s和62.4GiB/s,比国际同类技术快了6.7倍,相当于让加油站的油枪数量和加油速度实现了跨越式提升,大幅缩短了大模型训练时间,也降低了算力和运维成本。”

  记者了解到,这套存储系统目前可支持多达4096张算力卡协同工作,并通过多维数据管理技术让数据流动效率提升10倍。同时,系统将高密度存储介质与低能耗设计相结合,在大幅提升性能的同时减少了能源消耗和碳排放,为可持续发展的AI算力中心建设提供了范例。本次MLPerf测试佳绩,不仅证明国产存储系统已能从容应对万亿参数级大模型的训练需求,还将在医疗影像分析、气候模拟、遥感数据处理等关系民生与国家安全的重要领域广泛应用。