融合多模态信息的跨媒体知识文本分类算法

刘欢, 李宏亮, 陈维汉

吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (05) : 1138 -1143.

PDF
吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (05) : 1138 -1143. DOI: 10.19292/j.cnki.jdxxp.2025.05.002

融合多模态信息的跨媒体知识文本分类算法

    刘欢, 李宏亮, 陈维汉
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对跨媒体知识文本分类涉及多种类型的数据,并且其间的差异性和异构性增加了分类的复杂性,使大量跨媒体知识文本中难以精确寻找资料的问题,提出融合多模态信息的跨媒体知识文本分类算法。利用词频-逆文档频率(TF-IDF:Term Frequency-Inverse Document Frequency)算法,过滤处理文本中的停用词,提取文本特征,并将其与图像文本特征相融合;利用朴素贝叶斯分类器,判断跨媒体知识文本类别的归属,实现知识文本分类。通过实验分析结果表明,所提文本分类算法显著提升了跨媒体知识文本分类的性能和效率,使分类结果更加准确,查准率高达95.12%,漏检率维持在10%以下。

关键词

文本分类 / TF-IDF算法 / 双线性池化 / 朴素贝叶斯分类器

Key words

引用本文

引用格式 ▾
融合多模态信息的跨媒体知识文本分类算法[J]. 吉林大学学报(信息科学版), 2025, 43(05): 1138-1143 DOI:10.19292/j.cnki.jdxxp.2025.05.002

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

187

访问

0

被引

详细

导航
相关文章

AI思维导图

/