DMKK-means——一种深度多核K-means聚类算法

王梅, 宋凯文, 刘勇, 王志宝, 万达

山东大学学报(工学版) ›› 2024, Vol. 54 ›› Issue (06) : 1 -7+18.

王梅, 宋凯文, 刘勇, 王志宝, 万达

作者信息 +

Author information +

文章历史 +

PDF

摘要

针对传统K-means的聚类效果容易受到样本分布影响，且核函数表示能力不强导致对于复杂问题的聚类效果表现不佳的问题，利用深度核的强表示性并通过多核集成方式，提出一种具有强表示能力且分布鲁棒的深度多核K-means(deep multiple kernel K-means, DMKK-means)聚类算法。构建具有强表示能力的深度多核网络架构，在新的特征空间进行K-means聚类；基于Kullback-Leibler(KL)散度的聚类损失函数衡量该算法与2种基准聚类方法的差异；将该聚类算法建模成高效的端到端学习问题，利用随机梯度下降算法更新优化深度多核网络的权重参数。在多个标准数据集上进行试验，结果表明，相比于K-means、径向基函数核K-means(radial basis function kernel K-means, RBFKKM)及其他多核K-means聚类算法，该算法在聚类精度、归一化互信息和调整兰德系数指标上均有明显提升，验证该算法的可行性与有效性。