首页新闻科技创新中科院高能物理研究所 × 曙光AI，打造全球首个L2级高能物理大模型“溪悟

中科院高能物理研究所 × 曙光AI，打造全球首个L2级高能物理大模型“溪悟

力龙5 2025-04-30 20:08:35 阅读() 评论()

近年来，以大规模预训练模型为代表的人工智能技术迅猛发展，为科研创新提供了全新范式。中科院高能物理研究所依托正负电子对撞机等大科学装置，积累了海量高价值实验数据，如何高效…

近年来，以大规模预训练模型为代表的人工智能技术迅猛发展，为科研创新提供了全新范式。中科院高能物理研究所依托正负电子对撞机等大科学装置，积累了海量高价值实验数据，如何高效利用数据、加速成果产出，成为研究所面临的核心课题。

经过多方评估，中科院高能物理研究所选用曙光 AI 解决方案作为算力支撑，联合 DeepAI 深算智能引擎，自主研发出高能物理领域首款聚焦知识挖掘与发现的 L2 级大模型 —— 溪悟 (Xiwu)。

在项目推进中，研究所面临多重挑战：大模型训练所需的庞大算力资源存在行业性短缺；高价值科学数据需在安全可控的环境下实现内部深度挖掘；基座模型种类繁多，需精准适配领域需求。

借助DeepAI深算智能引擎，中科院高能物理研究所快速完成基座模型的适配优化与训练框架（如LlamaFactory、Xtuner、vLLM等）的精准选型，在两方面实现价值突破：

打通实验数据与理论研究的壁垒，帮助科学家快速定位关键信息，加速粒子物理、宇宙学等领域的研究进程；
通过极简的生态兼容设计，大幅降低模型微调与部署成本，为大模型在科研场景的规模化应用奠定基础。

经过微调训练，溪悟(Xiwu)-130 亿语言模型在100 个高能物理领域问答测试集上，采用人工评估的方法，与基准模型Vicuna-130亿相比，回答更加准确或持平的概率达到95%，性能明显优于基准模型。

中科曙光将持续携手中科院高能物理研究所，不断提升溪悟(Xiwu)大模型在Tokens限制解除、思维能力进化、图像处理优化等一系列能力，探索大模型在更多复杂科学问题中的应用潜力，推动科研范式智能化转型。

本文来自网络，不代表新质生产力网立场。转载请注明出处： http://www.xzicn.com/news/kjcx/2498.html

赞

标签:

作者: 力龙5

加快形成新质生产力！

为您推荐

评论列表()