您当前的位置 :浙江在线 > 浙江新闻 > 浙江纵横 正文

浙江破解AI诊疗“水土不服”

三百专家出真题 医疗大模型临床考

字体:
—2025—
12/04
07:20:41
2025-12-04 07:20:41 来源:浙江在线-浙江日报 记者 林晓晖

  浙江在线12月4日讯(记者 林晓晖)近年来,各类医疗大模型纷纷涌现,却缺乏严肃、权威、专业的评价体系。一个核心问题日益凸显:如何确保这些与百姓健康息息相关的AI产品安全、可靠?

  日前,国家人工智能应用中试基地(医疗)·浙江(下称“基地”)组建成立医学人工智能临床专家库。这支专家团队汇集了省内外41家医院和机构的近300名医学专家,覆盖64个专科领域。他们依托基地与中国医学科学院北京协和医学院、中国信息通信研究院共建的“医学人工智能测评验证联合实验室”,参与医疗大模型能力评测的标准建立、考题制作、结果审核等工作。目前,团队已完成超过20个医疗大模型的评测任务。

  “专家团队覆盖了内科、外科、妇产科、儿科等核心临床专科,并纳入了影像、病理等关键医技科室的权威专家。”医疗大模型评测技术负责人康俊晖介绍,“团队已构建超过6万道题的测评题库,建立初审、复审和抽样校验的三审机制。这套严谨的体系,相当于为医学人工智能量身定制了一套‘专业考题’。”

  这些考题围绕国家卫健委等部门联合发布的《卫生健康行业人工智能应用场景参考指引》设计,覆盖患者就医、医生诊疗等真实场景,构建了健康科普、分诊导诊、报告解读、用药指导、检验检查推荐、辅助诊断和辅助病历撰写等七大应用场景。

  在题型设计上,团队也进行了创新突破。康俊晖告诉记者:“除了常规的客观选择题,我们大幅增加了主观简答题比重,通过对大模型回答的深度分析,更准确地评估其临床推理能力。”他举例,其中一道主观简答题提供了一份复杂病历:一位中年肥胖患者,因“手脚麻木”就诊,但检查同时发现其血糖、血脂、尿酸、肝酶均显著升高,有高血压病史和糖尿病家族史。这道题不仅要求模型回答诊断结果,还要求其详细阐述诊断依据和思路,像临床医生一样进行综合推理,对可能存在的多种共病进行关联性考量。

  浙江省卫生健康信息中心主任李春浦说,应用在真实临床诊疗场景下的人工智能产品,仅靠掌握公开的医学教材、文献资料和个别医院的数据是远远不够的,否则会出现“水土不服”。“这就好比一个医学生,即便熟读教科书,经历了临床实习,仍难以胜任复杂的诊疗工作。因此,必须用大量的‘真案例、真标准’来检验,通过不同医院、不同领域真实的临床案例,包括疑难重症病例,参考国内外最新诊疗指南进行评测,才能科学评估人工智能在严肃医疗场景下的真实水平。”

  评测工作建立起长效的优化机制。康俊晖介绍,一般情况下,这些医疗大模型经过3至5轮测评,能力上便会有明显提升。目前,浙江正在开展医疗大模型第二轮测评验证工作。


版权和免责申明

凡注有"浙江在线"或电头为"浙江在线"的稿件,均为浙江在线独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"浙江在线",并保留"浙江在线"的电头。

标签:浙江责任编辑:黄泽杭
融媒产品
浙江宣传
群众工作室
90早新闻
精品专题
更多资讯