基于局部合力改进的Borderline-SMOTE过采样方法

吕峰, 宋媚, 赵礼, 祝义, 李赫男

南京师大学报(自然科学版) ›› 2025, Vol. 48 ›› Issue (05) : 93 -103.

PDF
南京师大学报(自然科学版) ›› 2025, Vol. 48 ›› Issue (05) : 93 -103.

基于局部合力改进的Borderline-SMOTE过采样方法

    吕峰, 宋媚, 赵礼, 祝义, 李赫男
作者信息 +

Author information +
文章历史 +
PDF

摘要

数据分类是保障大数据分析有效进行的关键环节,解决数据分类中的类别不平衡成为当前研究的热点.过采样技术凭借其简洁性、有效性等特点,成为处理类不平衡问题的主要途径之一.现有的过采样技术在处理不平衡数据中类重叠时缺乏合理的采样策略,导致机器学习模型预测时出现过拟合.因此,本文提出一种基于局部合力改进的Borderline-SMOTE过采样方法(IBSLG).首先,根据少数类样本最近邻分布构建边界区域;其次,基于局部合力计算边界区域内样本的集中度,根据集中度将样本划分为低概率/高概率边界样本;然后,基于两类边界样本分布,计算缩放因子构建新边界区域;最后,基于类不平衡比,对新边界区域自适应生成新样本.通过IBSLG与6种采样方法在4种分类器、8个不平衡数据集上进行对比实验,结果表明,IBSLG在大部分数据集上取得了最优的F1、G-mean、AUC和Friedman排名,并在大部分分类器上取得了最高的平均次优率,说明所提方法的有效性.

关键词

不平衡数据 / 过拟合 / 类重叠 / 过采样 / Borderline-SMOTE / 局部合力

Key words

引用本文

引用格式 ▾
基于局部合力改进的Borderline-SMOTE过采样方法[J]. 南京师大学报(自然科学版), 2025, 48(05): 93-103 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

96

访问

0

被引

详细

导航
相关文章

AI思维导图

/