基于标签概念的多标签文本分类方法

汪乐乐, 张贤坤

天津科技大学学报 ›› 2024, Vol. 39 ›› Issue (01) : 73 -80.

PDF (883KB)
天津科技大学学报 ›› 2024, Vol. 39 ›› Issue (01) : 73 -80. DOI: 10.13364/j.issn.1672-6510.20230044

基于标签概念的多标签文本分类方法

    汪乐乐, 张贤坤
作者信息 +

Author information +
文章历史 +
PDF (903K)

摘要

多标签文本分类是自然语言处理中重要且具有挑战性的任务之一。现有的方法注重文本表示学习,关注文本内部信息预测所属标签,忽略了属于某一标签的全体实例中共享的关键信息。鉴于此,本文提出一种基于标签概念的多标签文本分类方法:利用词频和潜在狄利克雷分布(latent Dirichlet allocation,LDA)方法从训练集全体实例中抽取各标签所对应的关键词,接着采取与文本编码相同方式对关键词编码,获得标签概念表示。在训练和预测过程中,检索与文本表示最相似的标签概念辅助分类,增加标签概念表示与文本表示的对比损失,使文本编码过程中能充分学习全局的标签概念信息。将本文方法嵌套在常用的多标签文本分类模型上进行实验,结果表明该方法有效提高了相应模型的性能。

关键词

标签概念 / 全局关键信息 / 对比损失 / 多标签文本分类

Key words

引用本文

引用格式 ▾
基于标签概念的多标签文本分类方法[J]. 天津科技大学学报, 2024, 39(01): 73-80 DOI:10.13364/j.issn.1672-6510.20230044

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (883KB)

106

访问

0

被引

详细

导航
相关文章

AI思维导图

/