基于类内和类间距离的粗粒度并行AP聚类算法

张素智, 杨芮, 陈小妮, 李鹏辉

华中师范大学学报(自然科学版) ›› 2018, Vol. 52 ›› Issue (06) : 781 -787+797.

PDF
华中师范大学学报(自然科学版) ›› 2018, Vol. 52 ›› Issue (06) : 781 -787+797. DOI: 10.19603/j.cnki.1000-1190.2018.06.005

基于类内和类间距离的粗粒度并行AP聚类算法

    张素智, 杨芮, 陈小妮, 李鹏辉
作者信息 +

Author information +
文章历史 +
PDF

摘要

近邻传播(Affinity Propagation,AP)聚类是基于数据点间消息传递的算法,主要通过数据间的相似度实现聚类.与传统的聚类方法相比,AP聚类无需事先给定聚类数目就可实现聚类,因此具有快速高效的优点,然而在处理高维复杂数据集时存在随着聚类效率提升而准确度不高的问题.为改善AP聚类算法的效率和精度,提出基于类内和类间距离的粗粒度并行AP聚类算法——IOCAP.首先引入粒度思想将初始数据集划分成多个子集;其次对各子集结合类内和类间距离进行相似度矩阵的改进计算,最后基于MapReduce模型实现改进后的并行AP聚类.在真实数据集上的实验表明,IOCAP算法在大数据集上有较好的适应性,能在保持AP聚类效果的同时有效地提升算法精度.

关键词

AP聚类 / 粒度思想 / 类内距离 / 类间距离 / 并行处理

Key words

引用本文

引用格式 ▾
基于类内和类间距离的粗粒度并行AP聚类算法[J]. 华中师范大学学报(自然科学版), 2018, 52(06): 781-787+797 DOI:10.19603/j.cnki.1000-1190.2018.06.005

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

74

访问

0

被引

详细

导航
相关文章

AI思维导图

/