网易有道“子曰4”多模态模型、语音合成模型全量开源

研究进展短期未必马上可用，但它常常预示下一代工具能力。普通用户可以把它当作趋势信号，关注后续是否被主流产品采用。

发生了什么

网易有道宣布将其“子曰”大模型4.0的多模态模型与语音合成模型面向全球全量开源。其中，多模态模型（27B参数）专注于教育场景，在处理高难度视觉数理问题上达到行业顶尖水平，纯文本中文数理难题准确率为81.4%。该模型通过思维链优化，将输出长度压缩43.2%，有效降低了推理成本。同时开源的语音合成模型支持跨语种音色与情感迁移克隆，3秒内即可完成零样本复制，准确度超97%，并支持包括中、英、日、韩在内的14种语言。

普通用户需要关注什么

重点看是否有开源实现、是否被主流产品引用，以及是否会在 1-3 个月内转化为可用工具。

打开来源