反超OpenAI 百川开源医疗大模型发布-科技先锋的专栏

反超OpenAI 百川开源医疗大模型发布

2025-08-12 14:00:05栏目：默认栏目 IP属地：IP未知

8月12日消息，百川智能发布开源医疗增强大模型Baichuan-M2。据悉，OpenAI于8月6日开源两款大模型，主打部署成本超低和医疗能力最强；5天后，百川开源更小尺寸模型并实现医疗能力反超。

今年1月，百川首发“AI患者模拟器”，用真实数据构造上万个不同年龄性别症状的AI患者，模拟了数百万次诊疗过程，基于该范式开源的Baichuan-M1，为行业首个医疗增强模型。7个月后，百川升级患者模拟器并引入模型端到端强化学习，训练的Baichuan-M2在HealthBench等评测上取得更大突破。

据悉，Baichuan-M2在HealthBench上得到60.1的高分，以32B的较小尺寸不仅反超OpenAI 最新开源模型gpt-oss120b（得分57.6），更是力压Qwen3-235B、Deepseek R1、Kimi K2等开源大模型。

据介绍，针对医疗领域用户隐私考虑下的模型私有化部署需求，百川智能对Baichuan-M2进行了极致轻量化，量化后的模型精度接近无损，可以在RTX4090上单卡部署，相比DeepSeek-R1 H20双节点部署的方式，成本降低了57倍。针对国产主流芯片的开发和适配，让多数医疗机构利用现有硬件条件既可实现快速部署。

此外，面向急诊、门诊等对于交互速度要求更高的场景，基于Eagle-3架构优化的Baichuan-M2 MTP版本在单用户场景下实现了74.9%的token速度跃升。

据了解，M2模型在数学、指令遵循、写作等通用核心性能上不降反升，因此这个模型也可应用于医疗以外的其他领域。

据悉，在北京市海淀区卫健委、北京大学第三医院、国家儿童医学中心等合作伙伴的支持下，M2在真实病例实测中体现出超强能力。

一位51岁女士近两个月睡眠充足依感困倦、疲惫，脖子轻微肿胀。M2根据医患对话，详细梳理出持续性疲劳、体重增加等多个支持诊断的关键症状，综合考虑患者用药史、年龄、合并症状等因素，精准诊断出患者最可能病因为甲状腺功能减退症。

内分泌科专家表示，M2在关键征象基础上提出首选假设（自身免疫性甲状腺炎）并列出直接佐证、反证，之后给出条理化的鉴别诊断的推理方式，属于典型的临床思维流程，符合临床医学中公认的SOAP分析方式（Subjective主观资料、Objective客观资料、Assessment评估、Plan计划）。它所采用的“支持 / 不支持”两栏逐一比对的方式也符合住院医师写病程记录时常用的思路，最后给出进一步检查与管理建议，充分体现出“闭环思维”。（定西）

来源: 网易科技报道