不拼参数拼医学：中国团队用“马具工程”+32B模型跑出医疗版“DeepSeek时刻”-大观网

2025年初，DeepSeek用更低的训练成本做出比肩全球主流大模型的能力，被不少业内人士称为“DeepSeek时刻”。

这件事的意义，不只是多了一个模型。

更关键的是，它动摇了一个长期被默认的前提——模型能力是否必须依赖更大的参数规模。

类似的变化，正在医疗AI领域出现。

一个不太一样的技术路径

近期，国内医疗科技公司良医汇联合智谱AI及多家三甲医院团队，在一项针对非小细胞肺癌（NSCLC）TNM分期的研究中，给出了一种不同于主流路径的解法。

他们没有选择更大的模型，而是基于国产32B模型GLM-4-Air，通过一套被称为 Medical-based Harness Engineering（医学工程化） 的方法，对模型进行重构。

简单来说，这种思路不是让模型“自己学会医学”，而是：

先把医学规则结构化，再让模型按规则推理。

为什么医疗场景很难被“通用能力”覆盖

TNM分期是肺癌诊疗中的核心环节，但同时也是一个典型的“复杂规则系统”：

这类任务对AI的要求，不只是“理解文本”，而是遵循医学规则进行多步骤推理。

也是在这样的场景下，单纯依赖大模型的通用能力，开始出现边界。

实验结果：中等规模模型反超GPT-4o

在发表于《JMIR AI》的研究中，良医汇团队将TNM分期任务拆解为多个可解释步骤，并针对不同子任务采用差异化优化策略。

在由三甲医院医生标注的数据集上，模型表现如下：

一个更关键的变化是：模型在输出结果的同时，会给出完整推理过程，包括每一步判断依据及对应的医学规则。

这意味着，医生不仅可以“用”，还可以“审”。

一个正在被验证的趋势：专业化优先于规模

如果把这次结果放在更大的背景下，它指向一个正在被反复验证的趋势：

在垂直领域，模型能力的上限，越来越取决于专业化适配能力，而不是参数规模。

类似的信号，在法律、金融等领域也开始出现。

从研究走向产品

上述方法已经被产品化。

良医汇推出的医生工具 MedSeek.Ai，目前已覆盖多个临床科室，并在实际医疗场景中服务超过10万名医生。

与依赖海外通用模型的产品不同，这类系统更强调：

在基层医疗机构中，这种能力的意义更直接——

它可能在一定程度上弥补专科医生资源不足带来的差距。

医疗AI的下一阶段，可能不是“更大”

从DeepSeek到类似MedSeek的尝试，一个变化正在变得清晰：

在通用大模型之外，越来越多行业开始探索自己的“专属解法”。

对于医疗这样的高门槛场景而言，问题可能不再是“有没有更大的模型”，而是：

有没有真正理解这个行业的AI产品。

本站转载的文章，版权归原作者所有；旨在传递信息，不代表本站的观点和立场。不对内容真实性负责，仅供用户参考之用，不构成任何投资、使用等行为的建议。如果发现有问题，请联系我们处理。

本站提供的草稿箱预览链接仅用于内容创作者内部测试及协作沟通，不构成正式发布内容。预览链接包含的图文、数据等内容均为未定稿版本，可能存在错误、遗漏或临时性修改，用户不得将其作为决策依据或对外传播。

因预览链接内容不准确、失效或第三方不当使用导致的直接或间接损失（包括但不限于数据错误、商业风险、法律纠纷等），本网站不承担赔偿责任。用户通过预览链接访问第三方资源（如嵌入的图片、外链等），需自行承担相关风险，本网站不对其安全性、合法性负责。

禁止将预览链接用于商业推广、侵权传播或违反公序良俗的行为，违者需自行承担法律责任。如发现预览链接内容涉及侵权或违规，用户应立即停止使用并通过网站指定渠道提交删除请求。

本声明受中华人民共和国法律管辖，争议解决以本网站所在地法院为管辖法院。本网站保留修改免责声明的权利，修改后的声明将同步更新至预览链接页面，用户继续使用即视为接受新条款。

不拼参数拼医学：中国团队用“马具工程”+32B模型跑出医疗版“DeepSeek时刻”