基于ADASYN和WGAN的混合不平衡数据处理方法

周万珍, 盛媛媛, 张永强, 马金龙

河北工业科技 ›› 2024, Vol. 41 ›› Issue (04) : 291 -298.

PDF
河北工业科技 ›› 2024, Vol. 41 ›› Issue (04) : 291 -298.

基于ADASYN和WGAN的混合不平衡数据处理方法

    周万珍, 盛媛媛, 张永强, 马金龙
作者信息 +

Author information +
文章历史 +
PDF

摘要

为了解决不平衡数据集中少数类样本分类精度较低的问题,提出了一种处理不平衡数据集的ADASYN-WGAN方法。首先,采用ADASYN(adaptive synthetic sampling)算法生成少数类样本,用这些生成样本代替WGAN(wasserstein generative adversarial networks)中的随机噪声;其次,利用WGAN算法生成符合原始数据集分布规律的少数类样本,构建平衡数据集;然后,在6个公开数据集上,采用随机森林分类器对所提方法和4种过采样算法得出的处理结果分别与原始数据集进行对比;最后,通过F1-Score, G-mean和AUC等分类评估指标的表现验证所提方法的有效性。结果表明:在对比实验中,经过ADASYN-WGAN方法得到的平衡数据集在随机森林分类器的十折交叉验证中,4个公开数据集中的各项分类评估指标值均达到最优,虽然另2个公开数据集中的AUC值略低,但其F1-Score和G-mean取得了最高值。所提出的ADASYN-WGAN方法可生成高质量的数据样本,并可为解决不平衡数据集中少数类样本的预测偏差问题提供参考。

关键词

数据处理 / 不平衡数据 / WGAN / ADASYN / 过采样方法 / 随机森林

Key words

引用本文

引用格式 ▾
基于ADASYN和WGAN的混合不平衡数据处理方法[J]. 河北工业科技, 2024, 41(04): 291-298 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

21

访问

0

被引

详细

导航
相关文章

AI思维导图

/