一种高效特征选择工具——森林演化算法

孙哲昊, 吕王勇, 刘娟, 张正军, 熊彬言

四川大学学报(自然科学版) ›› 2025, Vol. 62 ›› Issue (06) : 1317 -1326.

PDF
四川大学学报(自然科学版) ›› 2025, Vol. 62 ›› Issue (06) : 1317 -1326. DOI: 10.19907/j.0490-6756.250088

一种高效特征选择工具——森林演化算法

    孙哲昊, 吕王勇, 刘娟, 张正军, 熊彬言
作者信息 +

Author information +
文章历史 +
PDF

摘要

随着数据挖掘与机器学习方法的快速发展,高维数据的“维度灾难”问题越来越严重地制约着数据处理方法的效率,不仅加重计算负担、延长训练时间,还可能导致特征冗余、噪声干扰及过拟合问题,影响方法的稳定性和适应性.解决这个问题的一种办法是对高维数据进行降维处理.作为一种重要降维方法,特征选择算法能够有效提取高维数据中的关键特征,减少无效或冗余的信息.本文基于随机森林演化及极大逻辑回归模型提出了一种特征选择算法,算法通过逐步优化筛选形成最具代表性的数据特征的集合,在降低数据维度的同时确保分类的精度和特征筛选的稳定性.为了确保筛选出的特征对不同数据划分均能保持良好的泛化能力,本文在COVID-19相关基因数据集上进行仿真,并采用十折交叉验证方法评估了算法的稳定性.结果表明,算法适用于高维数据环境,能够有效筛选关键特征、减少计算负担,可被用于筛选生物医学数据中的潜在生物标志物.

关键词

大数据 / 维度灾难 / 特征选择 / 极大逻辑回归模型

Key words

引用本文

引用格式 ▾
一种高效特征选择工具——森林演化算法[J]. 四川大学学报(自然科学版), 2025, 62(06): 1317-1326 DOI:10.19907/j.0490-6756.250088

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

2

访问

0

被引

详细

导航
相关文章

AI思维导图

/