基于知识增强的文本分类方法

张博伦, 赵亚慧, 姜克鑫, 卢星华

延边大学学报(自然科学版) ›› 2024, Vol. 50 ›› Issue (02) : 78 -86.

PDF
延边大学学报(自然科学版) ›› 2024, Vol. 50 ›› Issue (02) : 78 -86. DOI: 10.16379/j.cnki.issn.1004-4353.2024.02.018

基于知识增强的文本分类方法

    张博伦, 赵亚慧, 姜克鑫, 卢星华
作者信息 +

Author information +
文章历史 +
PDF

摘要

为了解决文本分类任务中因部分数据质量差、数据不平衡和数据集过小等原因而导致的分类不准确问题,提出了一种基于知识增强的文本分类算法.首先,该算法通过加入外部知识对数据集进行数据增强;其次,使用GloVe词向量对原始文本和外部知识进行词嵌入,并使用CNN、LSTM和BERT模型提取文本特征;再次,将提取到的原始文本特征和外部知识文本特征进行融合,以此得到最终的文本特征;最后,将融合后的文本特征送入多层感知机进行分类,以此得到文本分类的最终结果 .在不同数据集上进行实验显示:在SST-5数据集上,模型CNN(KB)、LSTM(KB)和BERT(KB)的文本分类准确率比基线模型分别提高了5.01%、7.92%和1.5%;在SST-2数据集上,模型LSTM(KB)和BERT(KB)的文本分类准确率比基线模型分别提高了1.76%和1.29%;在IMDB数据集上,模型CNN(KB)、LSTM(KB)和BERT(KB)的文本分类准确率比基线模型分别提高了0.97%、2.87%和0.76%.上述结果表明,该文本分类算法可有效提高文本分类的准确性,并可为不同领域的文本分类应用提供参考.

关键词

深度学习 / 神经网络 / 文本分类 / 知识增强 / 特征提取

Key words

引用本文

引用格式 ▾
基于知识增强的文本分类方法[J]. 延边大学学报(自然科学版), 2024, 50(02): 78-86 DOI:10.16379/j.cnki.issn.1004-4353.2024.02.018

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

64

访问

0

被引

详细

导航
相关文章

AI思维导图

/