基于改进SMOTE算法和Ensemble模型的学习结果预测方法

王晓勇, 胡胜利

中北大学学报(自然科学版) ›› 2024, Vol. 45 ›› Issue (03) : 257 -264.

PDF
中北大学学报(自然科学版) ›› 2024, Vol. 45 ›› Issue (03) : 257 -264.

基于改进SMOTE算法和Ensemble模型的学习结果预测方法

    王晓勇, 胡胜利
作者信息 +

Author information +
文章历史 +
PDF

摘要

为解决不同领域的数据分类和预测任务中单个机器学习算法适用性较差的问题,以及缓解数据集严重不平衡对预测性能的影响,提出了基于合成少数类过采样(SMOTE)和Ensemble集成模型的数据分类方法。传统SMOTE算法通过对少数类样本进行插值来生成新的合成样本,合成样本中存在噪声和样本间相似性较高的问题。为此,提出了改进的SMOTE算法,通过距离计算移除噪声样本和易混淆样本,得到高区分度的纯净合成样本。然后,利用Ensemble方法调整样本和分类器权重,并组成分类效果更好的强分类器。在公开在线学习数据集Kalboard360上的实验结果表明,使用极限随机树(ERT)分类器时,结合改进SMOTE和Ensemble模型后实现了97.9%的预测准确度,比单个ERT分类器提升了5.5%,证明所提改进SMOTE算法能够生成高质量的均衡化数据,且集成学习模型的性能显著优于单个机器学习算法。

关键词

机器学习 / 神经网络 / 数据挖掘 / 集成学习 / 数据均衡化 / 学习结果预测

Key words

引用本文

引用格式 ▾
基于改进SMOTE算法和Ensemble模型的学习结果预测方法[J]. 中北大学学报(自然科学版), 2024, 45(03): 257-264 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

62

访问

0

被引

详细

导航
相关文章

AI思维导图

/