医学视觉问答中的问题类型与答案一致性校验

戴舒婷, 刘利军, 杨小兵, 黄青松, 袁钰博

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (04) : 922 -931.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (04) : 922 -931. DOI: 10.20009/j.cnki.21-1106/TP.2023-0612

医学视觉问答中的问题类型与答案一致性校验

    戴舒婷, 刘利军, 杨小兵, 黄青松, 袁钰博
作者信息 +

Author information +
文章历史 +
PDF

摘要

医学视觉问答(Med-VQA)旨在根据医学影像内容准确回答临床问题,具有巨大应用潜力.现有Med-VQA方法大都统一处理开放式问题和封闭式问题,忽略了问题的复杂多变性,导致模型准确率较低.同时,受语言先验影响,模型容易利用数据集中问答对的分布规律,削弱了问题与答案的深层关系,导致出现答非所问现象.针对以上问题,本文提出一种即插即用的细粒度问题类型与答案一致性校验方法.首先,识别输入问题为开放式或封闭式类型以实现参数不共享的独立推理;然后,对开放式问题细粒度分类以进一步捕获复杂开放式问题对答案的约束关系;最后,根据问题类型生成答案掩码掩盖无关答案,实现问题类型与答案的一致性校验,进而缓解答非所问现象.在公共数据集SLAKE和VQA-RAD上的实验结果表明,本文方法能有效提高Med-VQA准确率.

关键词

医学视觉问答 / 细粒度问题类型 / 答案掩码 / 一致性校验

Key words

引用本文

引用格式 ▾
医学视觉问答中的问题类型与答案一致性校验[J]. 小型微型计算机系统, 2025, 46(04): 922-931 DOI:10.20009/j.cnki.21-1106/TP.2023-0612

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

57

访问

0

被引

详细

导航
相关文章

AI思维导图

/