首页新闻科技创新 中科院高能物理研究所 × 曙光AI,打造全球首个L2级高能物理大模型“溪悟

中科院高能物理研究所 × 曙光AI,打造全球首个L2级高能物理大模型“溪悟

近年来,以大规模预训练模型为代表的人工智能技术迅猛发展,为科研创新提供了全新范式。中科院高能物理研究所依托正负电子对撞机等大科学装置,积累了海量高价值实验数据,如何高效…

近年来,以大规模预训练模型为代表的人工智能技术迅猛发展,为科研创新提供了全新范式。中科院高能物理研究所依托正负电子对撞机等大科学装置,积累了海量高价值实验数据,如何高效利用数据、加速成果产出,成为研究所面临的核心课题。

经过多方评估,中科院高能物理研究所选用曙光 AI 解决方案作为算力支撑,联合 DeepAI 深算智能引擎,自主研发出高能物理领域首款聚焦知识挖掘与发现的 L2 级大模型 —— 溪悟 (Xiwu)。

在项目推进中,研究所面临多重挑战:大模型训练所需的庞大算力资源存在行业性短缺;高价值科学数据需在安全可控的环境下实现内部深度挖掘;基座模型种类繁多,需精准适配领域需求。

借助DeepAI深算智能引擎,中科院高能物理研究所快速完成基座模型的适配优化与训练框架(如LlamaFactory、Xtuner、vLLM等)的精准选型,在两方面实现价值突破:

  • 打通实验数据与理论研究的壁垒,帮助科学家快速定位关键信息,加速粒子物理、宇宙学等领域的研究进程;
  • 通过极简的生态兼容设计,大幅降低模型微调与部署成本,为大模型在科研场景的规模化应用奠定基础。

经过微调训练,溪悟(Xiwu)-130 亿语言模型在100 个高能物理领域问答测试集上,采用人工评估的方法,与基准模型Vicuna-130亿相比,回答更加准确或持平的概率达到95%,性能明显优于基准模型。

中科曙光将持续携手中科院高能物理研究所,不断提升溪悟(Xiwu)大模型在Tokens限制解除、思维能力进化、图像处理优化等一系列能力,探索大模型在更多复杂科学问题中的应用潜力,推动科研范式智能化转型。

 

本文来自网络,不代表新质生产力网立场。转载请注明出处: http://www.xzicn.com/news/kjcx/2498.html
上一篇2025 TUYA全球开发者大会正式启幕,涂鸦智能以下一代AI硬件重构人机交互边界
下一篇 返回列表
力龙5

作者: 力龙5

加快形成新质生产力!

为您推荐

评论列表()

    联系我们

    联系我们

    1851688011@qq.com

    在线咨询: QQ交谈

    邮箱: 1851688011@qq.com

    工作时间:周一至周日,8:00-22:30,节假日无休息

    关注微信
    微信扫一扫关注我们

    微信扫一扫关注我们

    关注微博
    返回顶部