基于密度峰值的不确定性数据聚类算法

郎加云, 丁晓梅

吉林大学学报(信息科学版) ›› 2026, Vol. 44 ›› Issue (02) : 392 -398.

PDF
吉林大学学报(信息科学版) ›› 2026, Vol. 44 ›› Issue (02) : 392 -398. DOI: 10.19292/j.cnki.jdxxp.2026.02.011

基于密度峰值的不确定性数据聚类算法

    郎加云, 丁晓梅
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对不确定数据规模较大,类簇划分精准度受限,导致数据聚类效率较低的问题,提出基于密度峰值的不确定性数据聚类算法。利用马氏距离法,剔除相关性较小的干扰性样本数据,通过熵值计算不确定数据样本缺失值,逐步进行反向还原;利用密度峰值计算法确定类簇中心的分布情况,引入决策图,进行数据类簇划分;利用K近邻思想得到非类中心数据样本信任值,二次识别及划分类簇内信任值差距较大的数据点以及噪点,完成密度峰聚类法的优化。实验结果表明,面对大规模数据时,依然实现了类簇精准划分,聚类耗时较少。所提方法具有较高的运算效率,对不确定性数据挖掘与分析具有重大意义。

关键词

马氏距离法 / 熵值 / 决策图 / 密度峰值 / K近邻思想

Key words

引用本文

引用格式 ▾
郎加云, 丁晓梅. 基于密度峰值的不确定性数据聚类算法[J]. 吉林大学学报(信息科学版), 2026, 44(02): 392-398 DOI:10.19292/j.cnki.jdxxp.2026.02.011

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/