
昨天,百川智能正式发布医疗大模型 Baichuan-M3 Plus,官方宣称该模型在严肃医疗场景下的问答准确性与可靠性刷新了世界纪录。
据介绍,在 M3 基座模型的基础上,M3 Plus 凭借独创的六源循证技术,将幻觉率进一步降低至 2.6%,不仅优于 Open Evidence,相比 GPT-5.2 也大幅下降超 30%。
针对医疗 AI 常见的「幻觉」问题,M3 Plus 首创了「证据锚定(Evidence Anchoring)」技术。百川智能指出,临床医生在关注结论的流畅度之外,更看重背后的证据是否权威可追溯。
不同于行业通用的简单文献引用,M3 Plus 要求生成的每一句医学结论都精确对应到原始论文或指南的具体段落,避免了「张冠李戴」或引用内容与结论不匹配的情况。
为此,百川在训练中引入了 Citation Reward Model,对错误引用进行惩罚,最终实现了超过 95% 的结论与证据段落匹配准确率,使 AI 的医学判断具备可核验、可追责的特性。
在工程层面,M3 Plus 对系统进行了全面重构。通过 MoE 架构优化、模型量化以及 Gated Eagle-3 投机解码等技术,该模型在保证能力的前提下,将 API 调用成本较上一代降低了 70%,旨在降低 AI 进入临床一线和教学场景的门槛。
伴随新模型的发布,百川智能还宣布启动「海纳百川」计划。该计划面向所有服务医务工作者的机构,免费开放 M3 Plus 的 API 接口。适用对象涵盖医生、药剂师、护士及医学生等,使用场景限定于临床辅助决策和医学教育。
