三支边缘过采样的不平衡文本情感分类

余啟煬, 方宇, 李昭宸, 刘畅, 杨梅

重庆理工大学学报(自然科学版) ›› 2024, Vol. 38 ›› Issue (03) : 201 -211.

PDF
重庆理工大学学报(自然科学版) ›› 2024, Vol. 38 ›› Issue (03) : 201 -211. DOI: CNKI:SUN:CGGL.0.2024-03-022

三支边缘过采样的不平衡文本情感分类

作者信息 +

Author information +
文章历史 +
PDF

摘要

在实际应用中,少数类样本往往包含重要信息,而传统机器学习方法通常对少数类样本的分类准确率低,且误分类代价较高。针对不平衡文本数据的情感分类问题,以三支采样(three-way sampling, 3WS)与过采样为基础,提出了三支过采样算法(three-way SMOTE,3WOS)和三支边缘过采样算法(three-way borderline-SMOTE,3WOBS),3WOS能够更好地识别边界区域上的数据,3WOBS可以增强边界区域所蕴含的信息。首先,将文本数据构建为超球,获得超球边缘的支持向量。其次,3WOS对边缘上的支持向量直接进行过采样以生成合成新样本并更新样本集,3WOBS则在生成合成新样本后根据给定条件判断是否获得该新样本并更新样本集。最后,将更新的样本集放在不同的基分类器上进行对比实验。实验采用了3个不平衡数据集,并保证了不同的不平衡比。同时,在数据集训练过程中引入粒计算思想,确保模型的鲁棒性。实验结果表明,3WOS-ITSC与3WOBS-ITSC准确率较高且代价低于其他模型,为不平衡文本分类问题提供了新思路。

关键词

情感分类 / 不平衡数据 / 三支决策 / 采样 / 粒计算

Key words

引用本文

引用格式 ▾
余啟煬, 方宇, 李昭宸, 刘畅, 杨梅. 三支边缘过采样的不平衡文本情感分类[J]. 重庆理工大学学报(自然科学版), 2024, 38(03): 201-211 DOI:CNKI:SUN:CGGL.0.2024-03-022

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

60

访问

0

被引

详细

导航
相关文章

AI思维导图

/