启发式k-means聚类算法的改进研究

殷丽凤, 栗庆杰

大连交通大学学报 ›› 2024, Vol. 45 ›› Issue (02) : 115 -119.

PDF (1604KB)
大连交通大学学报 ›› 2024, Vol. 45 ›› Issue (02) : 115 -119. DOI: 10.13291/j.cnki.djdxac.2024.02.017

启发式k-means聚类算法的改进研究

作者信息 +

Author information +
文章历史 +
PDF (1642K)

摘要

启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结果的误差平方和较大并且轮廓系数偏小。针对这一问题,提出了CHk-means算法,该算法引入仔细播种方法,克服了启发式k-means算法随机选择初始聚类中心带来的局部最优解问题;该算法引入局部异常因子LOF算法对离群点进行检测,降低了离群点数据对聚类结果的影响。在多个数据集上对3种算法进行对比试验,结果表明CHk-means算法可有效降低聚类结果的误差平方和,增强聚类的轮廓系数,使聚类质量得到明显改善。

关键词

聚类算法 / k-means / 启发式算法 / 仔细播种 / 局部异常因子 / 离群点

Key words

引用本文

引用格式 ▾
殷丽凤, 栗庆杰 启发式k-means聚类算法的改进研究[J]. 大连交通大学学报, 2024, 45(02): 115-119 DOI:10.13291/j.cnki.djdxac.2024.02.017

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (1604KB)

34

访问

0

被引

详细

导航
相关文章

AI思维导图

/