一种软件缺陷不平衡数据分类新方法

刘文英, 林亚林, 李克文, 雷永秀

山东科技大学学报(自然科学版) ›› 2021, Vol. 40 ›› Issue (02) : 84 -94.

PDF (2163KB)
山东科技大学学报(自然科学版) ›› 2021, Vol. 40 ›› Issue (02) : 84 -94. DOI: 10.16452/j.cnki.sdkjzk.2021.02.010

一种软件缺陷不平衡数据分类新方法

    刘文英, 林亚林, 李克文, 雷永秀
作者信息 +

Author information +
文章历史 +
PDF (2214K)

摘要

针对软件缺陷预测数据中的数据不平衡、预测精度低以及特征维度高的问题,提出了一种RUS-RSMOTE-PCA-Vote的软件缺陷不平衡数据分类方法。首先通过随机欠采样来减少无缺陷样本的数量;在此基础上进行SMOTE过采样,在过采样中综合总体样本的分布状况引入影响因素posFac指导新样本的合成;对经过RUS-RSMOTE混合采样处理后的数据集进行PCA降维,最后应用Vote组合K最近邻、决策树、支持向量机构造集成分类器。在NASA数据集上的实验结果表明,与现有不平衡数据分类方法相比,所提方法在F-value值、G-mean值和AUC值上更优,有效地改善了软件缺陷预测数据集的分类性能。

关键词

软件缺陷预测 / 不平衡数据 / 混合采样 / 特征降维 / 集成分类器

Key words

引用本文

引用格式 ▾
一种软件缺陷不平衡数据分类新方法[J]. 山东科技大学学报(自然科学版), 2021, 40(02): 84-94 DOI:10.16452/j.cnki.sdkjzk.2021.02.010

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (2163KB)

145

访问

0

被引

详细

导航
相关文章

AI思维导图

/