基于群智能增强核极限学习机的创新人才预测模型

金庆良 ,  周鑫森 ,  陈翼 ,  吴承文

吉林大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (05) : 1763 -1771.

PDF (2222KB)
吉林大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (05) : 1763 -1771. DOI: 10.13229/j.cnki.jdxbgxb.20240906
计算机科学与技术

基于群智能增强核极限学习机的创新人才预测模型

作者信息 +

Predictive model for identifying innovative university talents based on the swarm intelligence evolution enhanced kernel extreme learning machine

Author information +
文章历史 +
PDF (2275K)

摘要

为解决高校创新人才传统预测方法存在主观性强、准确度低等问题,提出了一种融合信息引导交流搜索策略的粒子群优化算法与核极限学习机的高校创新人才智能预测模型。该模型利用改进的粒子群优化算法增强种群多样性与全局寻优能力,以提升核极限学习机的分类性能,旨在更科学、客观地识别与选拔创新人才。为验证模型有效性,通过十折交叉验证在高校创新人才数据集上进行实验,结果表明:本文模型在分类准确率(86.05%)、灵敏度(89.74%)、特异性(83.24%)和马修斯相关系数(72.42%)上均优于多种对比模型 。研究结果证实了该模型在高校创新人才预测方面的显著优势,为人才的科学选拔与培养提供了新的技术手段,具备良好的应用前景。

Abstract

To address the issues of strong subjectivity and low accuracy in traditional methods for predicting innovative talents in higher education, this paper proposes an intelligent predictive model that combines a Particle Swarm Optimization algorithm, enhanced with an Information-Guided Communication Search strategy, with a Kernel Extreme Learning Machine. This model aims to more scientifically and objectively identify and select innovative talents by utilizing the improved Particle Swarm Optimization algorithm to enhance population diversity and global search capabilities, thereby improving the classification performance of the Kernel Extreme Learning Machine. To validate its effectiveness, experiments were conducted on a university innovation talent dataset using 10-fold cross-validation. The results demonstrate that the proposed model outperforms several comparative models in key evaluation metrics, including classification accuracy (86.05%), sensitivity (89.74%), specificity (83.24%), and Matthews correlation coefficient (72.42%). These findings confirm the significant advantages of the proposed model in predicting innovative university talents, offering a new technical approach for the scientific selection and cultivation of talent with promising application prospects.

Graphical abstract

关键词

机器学习 / 创新人才预测 / 核极限学习机 / 粒子群优化

Key words

machine learning / prediction of innovative talent / kernel extreme learning machine / particle swarm optimization

引用本文

引用格式 ▾
金庆良,周鑫森,陈翼,吴承文. 基于群智能增强核极限学习机的创新人才预测模型[J]. 吉林大学学报(工学版), 2025, 55(05): 1763-1771 DOI:10.13229/j.cnki.jdxbgxb.20240906

登录浏览全文

4963

注册一个新账户 忘记密码

0 引 言

随着现代社会的不断发展和进步,社会对高级人才的需求日益迫切。高等教育在高级人才的培养中发挥着非常重要的作用12。在21世纪这个知识和人才的时代,社会对具有科研创新能力的人才需求尤为突出。大学生接受了系统的高等教育,掌握了专业知识和技能,具备了一定的理论基础和实践能力3。因此,培养大学生的过程就是培养人才的过程。近年来,培养具有科研创新能力的大学生逐渐成为高等教育的重要组成部分,这是高等教育由应试教育向素质教育转变的必然过程4。这一转变不仅有助于提高大学生的综合素质,还能为社会输送更多高素质、创新型的人才56。因此,高校创新人才预测显得尤为重要。

高校创新人才预测可以帮助教育机构更好地识别和培养潜在的科研创新人才,从而优化教育资源的配置,提高教育质量和效率7。通过科学的预测方法,可提前发现具有创新潜质的学生,并给予他们更多的资源和支持,帮助他们在科研创新的道路上走得更远。同时,公平、客观的预测机制有助于减少人为因素对人才选拔的影响,使更多有才华的学生能获得展示和发展的机会8。这不仅有利于个人的发展,还有助于社会整体人才结构的优化。

近年来,随着计算机技术的发展,机器学习逐渐成为较为热门的一个研究方向。作为人工智能的一个重要分支,机器学习能够通过分析大量历史数据,自动发现数据中的潜在规律和模式,并进行预测9。与传统的统计方法相比,机器学习具有更高的准确性和灵活性,能够处理复杂、高维的数据。据调研,目前少有使用机器学习技术来进行高校创新人才预测的研究。因此,本文提出了一种基于元启发式算法的智能预测模型对高校创新人才进行预测。

元启发式算法是一类通过启发式规则和搜索策略,探索问题的解空间,以找到全局最优解或近似全局最优解的优化算法10。常见的元启发式算法有差分进化算法(Differential evolution algorithm,DE)11、粒子群优化算法(Particle swarm optimization algorithm,PSO)12、蚁群优化算法(Ant colony optimization algorithm,ACO)13、灰狼优化算法(Grey wolf optimizer algorithm,GWO)14和鹦鹉优化算法(Parrot optimizer algorithm,PO)15等。近年来,元启发式算法被广泛应用于解决工程设计16、能源优化17、调度问题18和特征选择19等优化问题。

粒子群优化算法是一种基于鸟类群体觅食行为设计的群智能算法,PSO因其计算效率高、收敛速度快、实现简便而被广泛应用。PSO的基本思想是通过模拟一群粒子在搜索空间中的飞行来寻找最优解。每个粒子代表一个潜在解,具有位置和速度两个属性。位置表示当前的解,速度决定了粒子在搜索空间中的移动方向和距离。粒子在飞行过程中根据自己和群体的经验不断调整其速度,从而逐步逼近最优解。因此,其搜索过程不仅受个体经验的影响,还受到全体粒子经验的集体影响,这种集体智能机制使得PSO能够有效避免陷入局部最优解,具有较强的全局搜索能力。尽管PSO在许多优化问题中表现出色,但是其本身仍存在一些不足。比如,由于粒子在搜索空间中逐步靠近局部最优解,一旦粒子群集中在一个局部极值附近,算法可能难以跳出该区域,从而无法找到全局最优解。鉴于此,本文提出了基于信息引导交流搜索策略的改进PSO(PSO based on information-guided communication search strategy,ICSPSO)。该策略通过促进种群个体间的信息交流,从而提高种群丰富度,进而提高算法的寻优能力。随后,还提出了一种基于核极限学习机(Kernel extreme learning machine,KELM)20和改进粒子群优化算法的特征选择方法(bICSPSO-KELM)以提高高校创新人才的预测准确率。通过与同类型和经典分类器在数据集上的实验结果表明,本文提出的bICSPSO-KELM模型在马修斯相关系数(MCC)、分类准确率、灵敏度和特异性等4个指标上可以获得更佳的结果。

1 预测模型的建立

图1展示了本文模型的流程图。在本文采用10折交叉验证来综合评价所提出的智能预测模型的性能。因此,将给定的数据集分为10个子集,其中1个子集用作验证集,其余9个子集用作训练集。在使用训练集进行模型训练时,利用bICSPSO搜索最优特征子集。同时,采用KELM分类错误率和子集中的特征个数来评估子集的质量。搜索特征子集的具体步骤如下:

步骤1 对参数和种群进行初始化。包括种群大小N、最大迭代次数MaxFEs、维度Dim、种群X等。

步骤2 执行信息引导交流搜索策略。信息的传递发生在连续的层之间,通信实体由参考信息引导,逐步接近具有最优价值属性的优越信息。这些传输的消息具有不同程度的优先级,从而产生层次结构安排。具体数学公式如下:

ρα-information=CXα-information-Xit
X1=ρα-information-Aρα-information
C=2rand
A=a2rand-1
a=2sin πFEs1-FEs/MaxFEs

式中:Xit为搜索代理的主要位置向量,该变量表示第i个搜索代理在第t次迭代时的主要位置向量;ρα-information能够调节初始层搜索代理的探索范围;FEs为评价次数,MaxFEs为最大评估次数;X1为搜索代理修正后的位置向量,作为后续信息传递层的基础。第二层信息位置更新如下:

ρβ-information=CXβ-information-Xit
X2=Xβ-information-Aρβ-information+randX1

式中:ρβ-information在微调第二层搜索代理的勘探范围中起着关键作用;X2为修改后的搜索代理的位置向量。此外,rand的取值范围为[0,1]。

步骤3 在搜索到特征子集后,需要对特征子集的质量进行评估。这一过程所采用的适应度函数如下所示:

Fitness=α×(1-Acc)+β×FnDim

式中:Acc为分类器的准确率;Fn为特征子集的数量;αβ为两个权重,取值分别为0.99和0.01。本文采用KELM作为分类器。极限学习机(Extreme learning machine,ELM)21是一种单隐层前馈神经网络,以其简洁性和卓越性能著称。然而,ELM表现出一定的不稳定性。为提升其性能,Huang等20引入了核函数的概念,进而形成了KELM。

步骤4 检查是否满足停止条件(当前迭代次数是否大于最大迭代次数),如不满足,则返回到步骤2。若停止条件满足,则输出最优特征子集,使用验证集对模型性能进行验证。

上述过程重复10次,并将这10次运行的性能评估指标的平均值作为模型的最终性能结果。

2 实验设计

2.1 数据描述

为了探究影响高校创新人才的因素,本文进行了一项在线匿名调查。参与调查的对象为我国境内39所参与“强基计划”高校的学生。问卷共有51个选择题。表1列出了在线问卷的详细信息。本次调查共回收有效问卷1 047份。根据量表打分显示,其中534位学生表现为具有创新能力,513位学生表现为不具备创新能力。

2.2 实验设置

所有实验都将在一台64位体系结构、2.60 GHz处理器和32 GB RAM的高性能机器上进行的,在MATLAB 2022b环境下运行整个程序。此外,为了体现所提方法在解决特征选择的优越性,选取了3个基于群智能算法的特征选择模型(PbGSK_V4-KELM、bPSO-KELM和bABC-KELM)和4个常用的高效机器学习模型(XGBoost、RandomF、KELM和SVM)与本文所提方法一同在数据集上进行了比较。表2给出了所有比较算法参数的具体设置。为了防止过拟合,采用10折交叉验证方法来评估各方法的分类准确度。

2.3 性能评估

在本实验中,采用分类准确率(Accuracy)、灵敏度(Sensitivity)、特异性(Specificity)和马修斯相关系数(MCC)作为实验结果的评估指标。这些评估指标的具体计算公式如下:

Accuracy=TN+TPTN+FP+TP+FN
Sensitivity=TPTP+FN
Specificity=TNFP+TN
MCC=TP*TN-FP*FN(TP+FP)(TP+FN)(TN+FP)(TN+FN)

式中:FPTP分别为假阳性和真阳性;FNTN分别为假阴性和真阴性。

3 实验结果与分析

为了探索不同转换函数下bICSPSO-KELM对高校创新人才预测的影响,本实验首先对不同的转换函数对bICSPSO-KELM的性能影响进行研究。图2展示了不同转换函数情况下bICSPSO-KELM分类结果的平均误差直方图。不难看出,这些转换函数都展示出一致的效果,表现均良好。详细的展示见表3,展示了在不同转换函数下,bICSPSO-KELM模型在高校创新人才数据集上的分类结果,包括准确率、敏感度、特异度和马修斯相关系数的均值和方差。从表3中数据可以看出,不同转换函数对模型性能有一定影响。首先,bICSPSO-KELM模型在转换函数V1下表现最佳。该设置的准确率为86.05%,敏感度为89.74%,特异度为83.24%,MCC为72.42%。相比于其他转换函数,V1的准确率和敏感度均为最高,显示出模型在正确分类学生创新能力的同时,能更好地识别正类样本。V1的马修斯相关系数为72.42%,也表现了较为平衡的分类性能。

相比之下,转换函数S1的准确率为85.02%,敏感度为87.94%,特异度为83.13%,MCC为70.45%,尽管这些指标也较为接近V1的结果,但整体略逊一筹。S1下的MCC方差较大(0.06),这表明模型在不同实验中的表现不如V1稳定。同样,转换函数S2和S4的结果也表现较为接近,但均低于V1。S2的准确率为85.19%,敏感度为88.85%,特异度为82.54%,MCC为70.79%;S4的准确率为85.10%,敏感度为88.77%,特异度为82.43%,MCC为70.59%。这两种情况下在准确率和敏感度上与V1接近,但在马修斯相关系数上略显逊色,且S2的方差(0.07)相对较大,表明其稳定性稍差。最后,转换函数S3的性能略微低于上述几种配置,准确率为85.00%,敏感度为86.80%,特异度为83.91%,MCC为70.32%。S3的特异度相对较高,但敏感度稍低,这意味着模型在识别正类样本方面存在一定的不足。

综合来看,V1无论是在准确率、敏感度、特异度还是MCC方面都表现最佳,且其方差最小,说明V1在稳定性和预测精度方面的表现最为突出。因此,将转换函数V1作为后续实验中的参数。

在确定了最佳转换函数后,再详细评估bICSPSO-KELM模型在高校创新人才数据上的预测性能,具体结果如表4所示。表4中展示了10折交叉实验的结果,可以看出,bICSPSO-KELM模型在多个性能指标上均表现出色。其平均准确率为86.05%,表明模型在大多数情况下能够准确分类学生的创新能力;平均敏感度为89.74%,显示出模型在识别正类样本方面具有较强的能力,且稳定性较高(方差为0.03);平均特异性为83.24%,尽管在识别负类样本时有所波动(方差为0.05),但整体表现依然较好;马修斯相关系数的均值为72.42%,综合反映了模型的整体分类性能,尽管存在一定波动(方差为0.08)。因此,bICSPSO-KELM模型在高校创新人才预测任务中总体表现良好,尤其在正类样本的识别上具有显著优势,但在负类样本的识别上仍存在改进空间。

为了评估本文提出的bICSPSO-KELM模型的有效性,将其与其他同类型模型(包括PbGSK_V4-KELM、bPSO-KELM和bABC-KELM)以及常用的高效机器学习模型(如XGBoost、RandomF、KELM和SVM)进行了对比实验。实验通过10折交叉验证法,确保结果的可靠性和稳定性。图3展示了8种方法在分类准确率、灵敏度、特异性和MCC这4个评价指标上的对比结果,以箱型图形式呈现,可以明显看出,bICSPSO-KELM的箱型图显著高于其他模型,表明其在分类任务中具有整体优势。具体而言,bICSPSO-KELM的分布区间较为集中,展示了该模型在多次实验中的高度稳定性。与此相比,传统模型如RandomF和KELM的分布较为分散,存在较大的波动,显示出它们在高校创新人才数据集上的表现不够一致,结果差异较大。尽管bICSPSO-KELM在特异性方面略逊色于PbGSK_V4-KELM,但在平衡正负样本分类任务中,bICSPSO-KELM明显优于XGBoost、RandomF、KELM和SVM,展现了其出色的分类能力。在灵敏度的比较中,bICSPSO-KELM与XGBoost表现较为突出。虽然RandomF、KELM和SVM在灵敏度上的波动较小,但bICSPSO-KELM能在各类样本中保持更好的表现,充分体现了其对不同类别数据的敏感性。

此外,bICSPSO-KELM在MCC(Matthews相关系数)指标上也显著优于其他模型,进一步证明了其在分类任务中的卓越性能和稳定性。此外,从图3中还可以观察到,融合特征选择方法的模型(如bICSPSO-KELM、PbGSK_V4-KELM、bPSO-KELM和bABC-KELM)整体表现出优于传统机器学习模型(如XGBoost、RandomF、KELM和SVM)的性能。这表明,带有特征选择优化的模型能捕捉数据中的关键特征,弥补单一分类器的不足,从而在预测性能上表现出色。

为了进一步验证bICSPSO-KELM的有效性,图4展示了bICSPSO-KELM、PbGSK_V4-KELM、bPSO-KELM和bABC-KELM的适应度值的收敛曲线。bICSPSO-KELM、PbGSK_V4-KELM和bPSO-KELM适应度值在优化初期便迅速下降,且整个曲线呈现出平稳且迅速的下降趋势,表明在优化过程中具有较快的收敛速度。相比之下,bABC-KELM 的收敛曲线下降较慢,尤其是在优化的前期阶段。在收敛的最终阶段,bICSPSO-KELM 的适应度值明显低于其他模型,显示出其优化结果的精确度。而 bPSO-KELM 和 bABC-KELM 尽管在收敛速度上有所提升,但在最终的精度上依然不及 bICSPSO-KELM,表明其最终结果的精度略逊一筹。整体而言,bICSPSO-KELM在整个优化过程中表现出最快的收敛速度和最高的收敛精度。与原始的bPSO-KELM相比,bICSPSO-KELM不仅加快了收敛速度,而且在最终收敛精度上也有显著提升。这表明,引入的信息引导交流策略有效地促进了种群个体间的信息交换,从而增加了跳出局部最优解的概率。

4 结束语

针对高校创新人才预测中传统方法主观性强、精度不足的现实问题,提出并验证了bICSPSO-KELM。研究的核心创新在于,将一种改进的信息引导交流搜索策略融入粒子群优化算法,显著增强了算法的种群多样性与全局寻优能力,有效避免了传统粒子群算法易陷入局部最优的缺陷。当应用于核极限学习机的特征选择时,该方法能更精准地捕捉影响学生创新能力的关键因素,从而解决了传统模型在该问题上预测性能不佳的难题。实验结果表明,本文模型在分类准确率、灵敏度、特异性及马修斯相关系数等关键性能指标上,均系统性地优于其他七种对比模型,证明了其在高校创新人才预测任务上的有效性和优越性。

尽管本文提出的模型取得了良好的预测效果,但仍存在可供探索与完善的空间。未来的研究可从算法的深度优化入手,进一步探索信息引导交流机制的内部参数对性能的影响,或尝试将其他新颖的启发式策略与之融合,以持续提升模型的收敛精度与稳定性。在此基础上,研究也应致力于数据维度的拓展,通过引入学生的在校行为数据与问卷数据进行多维度融合,构建更全面的评价体系,以期提升预测的泛化能力与鲁棒性。最后,模型的应用场景亦可进一步延伸至学业预警、心理问题识别等其他教育预测领域,以检验并发挥其在更广泛教育场景中的应用价值。

参考文献

[1]

Li J, Xue E.How talent cultivation contributes to creating world-class universities in China:a policy discourse analysis[J].Educational Philosophy and Theory, 2022, 54(12): 2008-2017.

[2]

史秋衡, 李瑞. 高校拔尖创新人才培养的价值逻辑、关键要素与路径选择[J]. 中国远程教育, 2024, 44(1): 15-24.

[3]

Shi Qiu-heng, Li Rui. Value logic, key elements and path selection of top innovative talents training in universities[J]. Distance Education in China, 2024, 44(1): 15-24.

[4]

李润亚, 张潮, 张珂, 大学生创新创业能力系统构成及其表现研究[J]. 教育理论与实践, 2024, 44(18): 10-15.

[5]

Li Run-ya, Zhang Chao, Zhang Ke, et al. A study on the system composition and performance of college students' innovation and entrepreneurship ability[J]. Educational Theory and Practice,2024,44(18):10-15.

[6]

Gao H W.Innovation and development of ideological and political education in colleges and universities in the network era[J]. International Journal of Electrical Engineering& Education,2021,60(Sup.2): 489-499.

[7]

李立国, 刘振天, 陈恩伦, 笔谈:大学可持续发展的多维思考[J] .现代大学教育, 2023, 39(6): 41-59.

[8]

Li Li-guo, Liu Zhen-tian, Chen En-lun, et al. Writing: multi-dimensional thinking on sustainable development of universities [J]. Modern University Education,2023,39(6): 41-59.

[9]

徐玉成, 王波, 朱萍. 科教融汇赋能职业教育人才培养的时代价值、现实困境及破解对策[J].教育学术月刊, 2023(9): 58-66.

[10]

Xu Yu-cheng, Wang Bo, Zhu Ping. The times value, realistic dilemma and solutions of talent training in enabling vocational education by integrating science and education[J]. Educational Academic Monthly, 2023(9): 58-66.

[11]

Liu Y. Construction of talent training mechanism for innovation and entrepreneurship education in colleges and universities based on data fusion algorithm[J].Frontiers in Psychology,2022,13: 968023.

[12]

周沂, 陈圆月, 冯皓月. 学科交叉推动拔尖创新人才培养的作用研究——来自S大学书院制的经验证据[J]. 湖南师范大学教育科学学报, 2024, 23(1): 33-43.

[13]

Zhou Yi, Chen Yuan-Yue, Feng Hao-yue. Research on the role of interdisciplinary interaction in promoting the cultivation of top innovative talents: empirical evidence from the college system of S University[J]. Journal of Education Science, Hunan Normal University, 2024, 23(1): 33-43.

[14]

Sarker I H.Machine learning:algorithms, real-world applications and research directions[J]. SN Computer Science, 2021, 2(3): No.160.

[15]

Mishra D K, Shinde V.6 A review of global optimization problems using meta-heuristic algorithm[M]∥Aditya K, Ashish K, Nhu Gia N, et al. Nature-Inspired Optimization Algorithms.Berlin,Boston;De Gruyter, 2021: 87-106.

[16]

Storn R, Price K. Differential evolution—a simple and efficient heuristic for global optimization over continuous spaces[J]. Journal of Global Optimization,1997, 11(4): 341-359.

[17]

Kennedy J, Eberhart R.Particle swarm optimization[C]∥Proceedings of ICNN'95-International Conference on Neural Networks, Perth, Australia, 1995:488968.

[18]

Dorigo M, Birattari M, Stutzle T. Ant colony optimization[J]. IEEE Computational Intelligence Magazine, 2006, 1(4): 28-39.

[19]

Mirjalili S, Mirjalili S M, Lewis A. Grey wolf optimizer[J].Advances in Engineering Software, 2014, 69: 46-61.

[20]

Lian J, Hui G, Ma L, et al.Parrot optimizer: algorithm and applications to medical problems[J]. Computers in Biology and Medicine, 2024, 172: 108064.

[21]

Chauhan S, Vashishtha G, Abualigah L, et al.Boosting salp swarm algorithm by opposition-based learning concept and sine cosine algorithm for engineering design problems[J].Soft Computing, 2023, 27(24):18775-18802.

[22]

Gao R, Tao J, Zhang J,et al.NSGA-Ⅲ-SD based fuzzy energy management system optimization for lithium battery/supercapacitor HEV[J].Applied Soft Computing, 2023, 142: 110280.

[23]

Dong R, Sun L, Ma L, et al.Boosting kernel search optimizer with slime mould foraging behavior for combined economic emission dispatch problems[J]. Journal of Bionic Engineering, 2023, 20(6): 2863-2895.

[24]

Pan X, Zhang G, Lin A,et al.An evaluation model for children's foot& ankle deformity severity using sparse multi-objective feature selection algorithm[J]. Computers in Biology and Medicine, 2022, 151: 106229.

[25]

Huang G B, Zhou H, Ding X,et al. Extreme learning machine for regression and multiclass classification[J].IEEE Transactions on Systems, Man, and Cybernetics,Part B(Cybernetics), 2012, 42(2): 513-529.

[26]

Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006, 70(1): 489-501.

基金资助

浙江省高质量哲学社会科学重点研究基地--浙社科办([2024]50)

AI Summary AI Mindmap
PDF (2222KB)

166

访问

0

被引

详细

导航
相关文章

AI思维导图

/