AI能力成长中心
AInterest能力成长中心
让每个人都能掌握AI,提升能力,创造价值

首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布

研究进展短期未必马上可用,但它常常预示下一代工具能力。普通用户可以把它当作趋势信号,关注后续是否被主流产品采用。

首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
最近更新:2026-05-22
研究进展短期未必马上可用,但它常常预示下一代工具能力。普通用户可以把它当作趋势信号,关注后续是否被主流产品采用。

发生了什么

ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术,使模型内存占用相比BF16降低约6倍,可高效部署于手机、电脑、车载设备等边缘端。更关键的是,整个训练全栈(从量化算子到框架)均在昇腾上原生构建与验证,而非简单移植。该模型家族(0.5B-8B)在多项基准测试上保持了全精度模型95-97%的性能,为资源受限环境下部署和复现大模型提供了可落地的解决方案。

普通用户需要关注什么

重点看是否有开源实现、是否被主流产品引用,以及是否会在 1-3 个月内转化为可用工具。

打开来源