面向不平衡数据的提升均衡集成学习算法

白琳, 俱通, 王浩, 雷明珠, 潘晓英

山东大学学报(工学版) ›› 2024, Vol. 54 ›› Issue (04) : 59 -66.

PDF
山东大学学报(工学版) ›› 2024, Vol. 54 ›› Issue (04) : 59 -66.

面向不平衡数据的提升均衡集成学习算法

    白琳, 俱通, 王浩, 雷明珠, 潘晓英
作者信息 +

Author information +
文章历史 +
PDF

摘要

为有效解决欠采样技术在处理不平衡数据时的伪平衡问题,提出并设计一种基于欠采样的提升均衡集成学习算法。采用新的均衡采样机制,通过分箱操作协调数据的预测概率,生成高质量的训练子集,以此迭代训练分类器。基于基分类器在原始数据上的假阳性率和假阴性率,在迭代过程中自适应为其分配权重,避免性能较差的分类器影响整体决策,提高集成模型的泛化能力。新的算法能够在消除伪平衡的同时增加多数类样本的识别度,从而降低边界模糊对分类模型的影响。通过18组小型数据集和2组大型数据集的对比试验表明,该算法具有处理不平衡数据分类问题的优势。

关键词

欠采样 / 类不平衡 / 不平衡学习 / 集成学习 / 不平衡数据分类

Key words

引用本文

引用格式 ▾
面向不平衡数据的提升均衡集成学习算法[J]. 山东大学学报(工学版), 2024, 54(04): 59-66 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

70

访问

0

被引

详细

导航
相关文章

AI思维导图

/