句子级时序卷积网络的多模态抑郁症识别方法

王烽飞, 卓广平, 周金保, 刘国强, 张光华

中北大学学报(自然科学版) ›› 2024, Vol. 45 ›› Issue (03) : 274 -285.

PDF
中北大学学报(自然科学版) ›› 2024, Vol. 45 ›› Issue (03) : 274 -285.

句子级时序卷积网络的多模态抑郁症识别方法

    王烽飞, 卓广平, 周金保, 刘国强, 张光华
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对多模态抑郁症模型在特征提取时,语句间关联性较弱,不同模态间的特征融合较为随意,在中文数据集上模型的泛化能力缺乏验证等问题,本文通过分析与抑郁症相关的音频、文本和视觉特征,提出了基于改进TCN模型的多模态抑郁症识别模型STCMN(Sentence-level Temporal Convolutional Memory Network),并将该模型应用于临床抑郁症辅助诊断当中。该模型首先使用残差块、 GRU和Self-Attention的融合模块来提取不同模态下的句子级特征,增强了上下文联系,然后使用TCN模型来提取不同模态的全局特征,并使用Cross Attention对不同模态的全局特征以多模态融合特征为主进行融合,最后通过LogSoftmax层得到模型对抑郁症的识别结果。在DAIC-WOZ公开数据集上,本文所提出的方法对抑郁症识别的准确率达到了91.3%,精确率达到了93.6%,召回率达到了89.7%,其相关指标均优于其他方法,可以更好地满足临床医学的需求。在私有中文数据集MMD2022上,STCMN模型的识别结果仍为最优,表明该模型在中文抑郁症识别任务上具较好的泛化能力。

关键词

抑郁症 / 时序卷积网络 / 门控循环单元 / 自注意力机制 / 交叉注意力机制

Key words

引用本文

引用格式 ▾
句子级时序卷积网络的多模态抑郁症识别方法[J]. 中北大学学报(自然科学版), 2024, 45(03): 274-285 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

98

访问

0

被引

详细

导航
相关文章

AI思维导图

/