一种基于主题模型与迁移学习的文本分类方法

包翔, 汪满容, 刘桂锋

山东科技大学学报(自然科学版) ›› 2021, Vol. 40 ›› Issue (03) : 80 -88.

PDF (1320KB)
山东科技大学学报(自然科学版) ›› 2021, Vol. 40 ›› Issue (03) : 80 -88. DOI: 10.16452/j.cnki.sdkjzk.2021.03.010

一种基于主题模型与迁移学习的文本分类方法

    包翔, 汪满容, 刘桂锋
作者信息 +

Author information +
文章历史 +
PDF (1351K)

摘要

为了消除传统机器学习中分类方法的限制,提出一种基于主题模型与迁移学习的文本分类方法。将文本集合成由共同主题和特定主题所联合起来的混合模型;然后,通过这两类主题相关性推断出不同领域之间主题的映射关系;最后,融合共同主题以及映射后的特定主题形成一个新的特征空间,并在此特征空间中完成文本的分类。实验结果表明,相较于其他分类方法,本方法在国外的20newsgroups数据以及自建的中国专利数据集上能更加高效准确地预测未标记文本的类别,为文本挖掘领域相关方向的研究提供新的视角。

关键词

文本分类 / 主题模型 / 迁移学习 / 源领域 / 目标领域

Key words

引用本文

引用格式 ▾
一种基于主题模型与迁移学习的文本分类方法[J]. 山东科技大学学报(自然科学版), 2021, 40(03): 80-88 DOI:10.16452/j.cnki.sdkjzk.2021.03.010

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (1320KB)

96

访问

0

被引

详细

导航
相关文章

AI思维导图

/