网易有道AI团队近日正式开源了一款专为高级数学推理任务量身打造的多模态推理模型Confucius4。
该模型以当前先进的Qwen3.5-27B大语言模型架构为基础进行深度定制与优化,充分融合了大规模参数量带来的强大语义理解能力与数学逻辑推理能力。在训练策略上,团队采用了迭代式的监督微调(Supervised Fine-Tuning, SFT)结合强化学习(Reinforcement Learning, RL)的混合训练范式,并在此基础上引入了精细化的思维链(Chain-of-Thought, CoT)优化机制,显著提升了模型在复杂数学问题求解过程中的准确性与效率。实证评估表明,该模型在Math-Hard-500等多个具有挑战性的数学推理基准测试中,达到了与同规模模型相比的最先进(State-of-the-Art, SOTA)性能水平,同时成功将平均推理链长度缩短了43.2%,有效降低了计算开销并提升了响应速度。此外,该模型的中文版本Confucius4特别针对中文用户的使用习惯和语言特性进行了定向优化,不仅支持文本输入,还具备处理图文混合内容的能力,能够理解并分析包含公式、图表等视觉元素的数学题目。值得一提的是,Confucius4全面兼容Qwen生态系统,便于开发者和研究人员快速集成与部署。
客服热线:










