【读论文】医疗AI大模型:百川开源Baichuan-M2
1. 引言
最新百川开源了一个可以和openai新模型掰手腕的医疗垂直大模型:Baichuan-M2在HealthBench基准上取值60.1的高分,超过了gpt-oss-120b。这次一起回顾下百川给的技术报告。
2. Baichuan-M2概览:“模型+系统”
Baichuan-M2的成功源于一套精心设计的、端到端的训练与优化系统。
- 基础模型 (Base Model):论文披露,Baichuan-M2建立在Qwen2.5-32B模型之上。选择一个强大的开源模型作为基座,使其能够继承其原有的通用语言理解和推理能力。
- 训练范式:整个训练流程可以概括为两个核心阶段:
- 中期训练 (Mid-Training):一个高效的、有监督的微调阶段,旨在将海量、权威的医学知识注入模型,并教会模型“像医生一样”结构化地思考。
- 强化学习 (Reinforcement Learning):在自研的“虚拟临床世界”中进行大规模的交互式学习,通过与“虚拟病人”对话和“专家级”反馈,优化模型的诊断和治疗策略。