评估通用与领域特定大视觉模型在食管癌CT的T分期中的应用:一项关于零样本性能及提示词工程影响的研究

朱大兵, 高伟, 林杨皓, 赖武浩, 梁志超, 曾宪一, 邓希楷, 安军

中国医学物理学杂志 ›› 2025, Vol. 42 ›› Issue (11) : 1532 -1540.

PDF
中国医学物理学杂志 ›› 2025, Vol. 42 ›› Issue (11) : 1532 -1540.

评估通用与领域特定大视觉模型在食管癌CT的T分期中的应用:一项关于零样本性能及提示词工程影响的研究

    朱大兵, 高伟, 林杨皓, 赖武浩, 梁志超, 曾宪一, 邓希楷, 安军
作者信息 +

Author information +
文章历史 +
PDF

摘要

背景:食管癌精准T分期对治疗至关重要,但CT评估局限明显。大视觉模型(LVMs)提供了新可能,但其未经微调的“零样本”临床诊断能力尚待验证。方法:本研究回顾性分析98例食管癌及50例正常对照的胸部CT影像,在放射科专家共识的金标准下,通过不同复杂度的提示词,评估GPT-5、Gemini及MedGemma的零样本T分期性能。结果:GPT-5表现出最高的准确性与稳定性。模型间存在显著偏倚:Gemini倾向过度分期,MedGemma则倾向分期不足。所有模型对早期肿瘤判断均不佳,但结构化提示词能提升对中晚期病灶的诊断性能。结论:LVMs具备零样本T分期的潜力,但性能高度依赖模型选择与提示词设计。通用模型GPT-5的零样本泛化能力更优。当前模型性能,尤其在早期诊断上,远未达到临床应用标准。未来方向在于高质量数据微调与标准化提示框架开发。

关键词

食管癌 / 大视觉模型 / CT分期 / 提示词工程 / 领域专用模型 / 零样本学习 / 诊断准确性

Key words

引用本文

引用格式 ▾
评估通用与领域特定大视觉模型在食管癌CT的T分期中的应用:一项关于零样本性能及提示词工程影响的研究[J]. 中国医学物理学杂志, 2025, 42(11): 1532-1540 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

139

访问

0

被引

详细

导航
相关文章

AI思维导图

/