6月15日,中科曙光发布新一代通用高性能计算平台。该平台以国产百核级512线程通用CPU为核心,通过“算存网”全栈协同优化,以卓越性能带动国产通用计算比肩国际一流水准。
当前,全球算力产业焦点高度集中于大模型训推,但在科学与工程计算等对精度要求极高、计算复杂度极高的场景中,通用计算能力仍是不可替代的基石。该平台提供风冷、冷板液冷、浸没液冷三种散热形态的计算节点,可灵活覆盖不同算力规模的计算场景。
▍高精度算力底座加速突破
中科曙光新一代通用高性能计算平台搭载首个国产10T级通用CPU(128核、512线程、单CPU FP64双精度算力10T),HPL双精度浮点相对性能较当代提升近2倍,STREAM访存性能较当代提升近1倍,应用性能平均提升近1倍,均与国际主流高端平台处于同等水平。
性能突破的背后,是中科曙光“算—存—传”三级协同的系统级能力:
-
计算层引入BurstBuffer缓存加速与SocketDirect通信优化技术,进一步释放CPU算力;
-
存储层搭载ParaStor F9000,实现端到端无阻塞I/O;
-
网络层基于自研 scaleFabric 高速交换机,端到端时延低至0.93μs(其中交换机转发延时仅260ns),单子网支持11.4万卡组网,从根本上破解大规模并行场景下的“通信墙”问题;
-
结合HPC-Kit基础软件库,在编译优化、数学库优化、MPI通信库增强等多个环节实现系统级协同优化,从而提升整体计算效率。
▍对接全球HPC软件生态
高性能计算行业最难迁移的并不是硬件,而是数十年积累形成的软件体系与工程流程。工业仿真、材料计算、生物计算等领域的应用软件往往经过长期深度优化,迁移与重构成本极高。
该平台原生兼容x86生态,更是国内首个原生支持AVX-512指令集的国产通用计算平台。AVX-512已是全球HPC软件生态的事实标准,GROMACS、NAMD等核心科学计算套件均深度绑定其加速路径。
这种兼容性意味着现有HPC软件无需重新编译或修改源码即可直接运行,并自动调用AVX-512优化路径——用户软件授权、业务流程、工程经验全部保留,大幅降低生态迁移成本。
▍满足多样化部署需求
对于大型科研机构、区域算力中心以及工业计算平台而言,高密度部署、低PUE以及长期稳定运行能力,已成为高性能计算平台的重要指标。该平台提供风冷、冷板液冷、浸没液冷三种散热形态的计算节点:
-
2U风冷标准双路机架式服务器H620G59,单节点可提供20TFLOPS算力,性能强劲,配置灵活;
-
冷板式高密计算柜TC800 G6,单柜实现P级计算能力,PUE低至1.08;
-
浸没式超高密计算柜TC8600H G5则采用第三代浸没相变液冷技术,最高支持80000+ CPU核心部署,PUE进一步降至1.04。
多形态的部署不仅满足了用户多样化的应用需求、带来可靠的系统收益,更展现出国产高性能计算平台系统化的工程交付能力。
▍“超智融合”助力科学智能全面发展
科研机构与工业企业对于超智融合算力的需求出现爆发式增长:一方面利用AI提升模型训练与推理效率,另一方面依赖高性能计算平台完成复杂科学问题求解。未来科学研究既需要高精度科学计算能力,也需要低精度智能计算能力,数学模型与数据模型将形成深度互补,高精度与低精度算力协同运行。
目前,中科曙光新一代通用高性能计算平台已覆盖地球科学、工业制造、生命科学、物理化学材料等多个领域。其中,公里级天气模拟性能达到当代平台的1.95倍;工业仿真实测性能达到1.86倍,与国际主流高端平台处于同等水平。
中科曙光高级副总裁李斌表示,未来全球算力产业的发展,不只是单点硬件突破,而是从芯片、系统、平台到应用的全链路协同创新。面对科学智能时代的诸多挑战,中科曙光将牵头建立自主、开放、高效的全精度算力体系,加强“数算模用”深度协同,让数据、算力、模型与应用真正联动起来。


微信扫一扫打赏
支付宝扫一扫打赏

评论列表()