反超OpenAI 百川开源医疗大模型发布
2025-08-12 14:00:05
  • 0
  • 0
  • 0

8月12日消息,百川智能发布开源医疗增强大模型Baichuan-M2。据悉,OpenAI于8月6日开源两款大模型,主打部署成本超低和医疗能力最强;5天后,百川开源更小尺寸模型并实现医疗能力反超。

今年1月,百川首发“AI患者模拟器”,用真实数据构造上万个不同年龄性别症状的AI患者,模拟了数百万次诊疗过程,基于该范式开源的Baichuan-M1,为行业首个医疗增强模型。7个月后,百川升级患者模拟器并引入模型端到端强化学习,训练的Baichuan-M2在HealthBench等评测上取得更大突破。

据悉,Baichuan-M2在HealthBench上得到60.1的高分,以32B的较小尺寸不仅反超OpenAI 最新开源模型gpt-oss120b(得分57.6),更是力压Qwen3-235B、Deepseek R1、Kimi K2等开源大模型。

据介绍,针对医疗领域用户隐私考虑下的模型私有化部署需求,百川智能对Baichuan-M2进行了极致轻量化,量化后的模型精度接近无损,可以在RTX4090上单卡部署,相比DeepSeek-R1 H20双节点部署的方式,成本降低了57倍。针对国产主流芯片的开发和适配,让多数医疗机构利用现有硬件条件既可实现快速部署。

此外,面向急诊、门诊等对于交互速度要求更高的场景,基于Eagle-3架构优化的Baichuan-M2 MTP版本在单用户场景下实现了74.9%的token速度跃升。

据了解,M2模型在数学、指令遵循、写作等通用核心性能上不降反升,因此这个模型也可应用于医疗以外的其他领域。

据悉,在北京市海淀区卫健委、北京大学第三医院、国家儿童医学中心等合作伙伴的支持下,M2在真实病例实测中体现出超强能力。

一位51岁女士近两个月睡眠充足依感困倦、疲惫,脖子轻微肿胀。M2根据医患对话,详细梳理出持续性疲劳、体重增加等多个支持诊断的关键症状,综合考虑患者用药史、年龄、合并症状等因素,精准诊断出患者最可能病因为甲状腺功能减退症。

内分泌科专家表示,M2在关键征象基础上提出首选假设(自身免疫性甲状腺炎)并列出直接佐证、反证,之后给出条理化的鉴别诊断的推理方式,属于典型的临床思维流程,符合临床医学中公认的SOAP分析方式(Subjective主观资料、Objective客观资料、Assessment评估、Plan计划)。它所采用的“支持 / 不支持”两栏逐一比对的方式也符合住院医师写病程记录时常用的思路,最后给出进一步检查与管理建议,充分体现出“闭环思维”。(定西)

来源: 网易科技报道 

 
最新文章
相关阅读