基于邻域标准差的密度调整谱聚类算法

郭笑雨, 刘金金, 陈亚军, 李豪杰, 袁培燕, 赵晓焱

工程科学与技术 ›› 2025, Vol. 57 ›› Issue (02) : 40 -53.

PDF
工程科学与技术 ›› 2025, Vol. 57 ›› Issue (02) : 40 -53.

基于邻域标准差的密度调整谱聚类算法

作者信息 +

Author information +
文章历史 +
PDF

摘要

针对谱聚类在尺度参数计算时需要人为设置近邻参数及聚类结果不稳定等问题,本文将初始类中心值和尺度参数作为决策变量,重点对谱聚类算法进行自适应优化与改进。首先,将样本邻域标准差的倒数作为度量样本局部密度的参数,与密度峰值思想相结合,设计了一种基于密度峰值的初始类中心决策值选择方法(initial class center decision value algorithm based on density peak,DP_KD),解决密度调整谱聚类中聚类结果不稳定的问题。其次,利用样本间的平均距离计算相应的邻域半径,并根据样本标准差自适应地求解每个样本的尺度参数,构造样本间的相似度矩阵,实现了近邻参数的自适应设置,解决尺度参数需要人为设置的问题。然后,基于优化后的初始类中心决策值和近邻参数方法,进一步调整高斯核函数,提出一种基于邻域标准差的密度调整谱聚类算法(density adjusted spectral clustering algorithm based on neighborhood standard deviation,DSSD),通过构建特征向量空间实现了密度谱聚类。最后,将提出的算法与其他聚类算法在多个数据集上进行了对比。结果表明,与其他谱聚类算法相比,本文提出的DSSD算法不仅具有更好的聚类效果,且聚类结果更加稳定,尤其是在类内密集且类间边缘明确的DIM512数据集中,DSSD算法可以正确地进行聚类分簇;在准确率、兰德系数和F–measure上较其他算法至少提升了0.026 8、0.013 6和0.024 7,这表明DSSD算法不仅聚类效果较好且更适合大规模数据集的聚类分析。

关键词

谱聚类 / 密度调整 / 邻域标准差 / 自适应 / 密度峰值

Key words

引用本文

引用格式 ▾
郭笑雨, 刘金金, 陈亚军, 李豪杰, 袁培燕, 赵晓焱. 基于邻域标准差的密度调整谱聚类算法[J]. 工程科学与技术, 2025, 57(02): 40-53 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

4

访问

0

被引

详细

导航
相关文章

AI思维导图

/