PDF
摘要
首先,针对传统K-m eans算法在处理高维异构数据时存在特征平等假设导致重要特征被忽视、聚类结果对预设簇数高度敏感以及对初始中心点选择强依赖性的问题,提出一种自适应动态特征加权K-means (adaptive dynamic feature weighting K-means,ADFW-K-means)算法,该算法融合了动态特征加权、K-means++优化初始化、肘部法则辅助簇数选择、空簇处理机制以及自适应簇数调整策略等多项技术.其次,在吉林大学2022—2024年选调生数据集上进行实验,实验结果表明,ADFW-K-means算法相较于传统聚类算法,在轮廓系数、聚类稳定性和业务可解释性3个核心指标上均得到显著提升,ADFWK-means算法有效克服了传统方法的固有缺陷,显著提升了复杂高维异构数据聚类的准确性和鲁棒性.
关键词
自适应簇数
/
动态特征加权
/
K-means算法
/
聚类算法
Key words
基于自适应动态特征加权的K-means算法[J].
吉林大学学报(理学版), 2025, 63(05): 1404-1410 DOI:10.13413/j.cnki.jdxblxb.2025001