PDF
摘要
现有Relief算法在利用标记相关性方面存在不足,忽视了局部标记相关性所提供的宝贵信息。针对这一问题,提出了一种融合K-means聚类与标记相关性的多标记Relief特征选择方法。首先,为充分考虑样本标记相关性,采用K-means聚类算法对样本进行聚类,将其划分到不同的簇中,从而构建样本的局部标记空间。其次,定义了所有样本在特征上的欧式距离,以此衡量样本的全局标记相关性。同时,改进了传统的余弦相似度,使用L1范数的平方根进行优化,并在局部标记空间中应用改进的余弦相似度,以有效获取样本的局部标记相关性。最后,在Relief算法的基础上,融合了样本的全局标记相关性与局部标记相关性,以此作为衡量样本相似度的依据,进而判别最近邻同类样本与最近邻异类样本,最终获得特征权重。为评估所提算法的性能,在10个多标记数据集上进行了对比测试,实验结果证明,与其他多标记特征选择算法相比,本算法具有显著优势。
关键词
多标记学习
/
特征选择
/
K-means聚类
/
标记相关性
/
Relief算法
Key words
融合K-means聚类和标记相关性的多标记Relief特征选择[J].
聊城大学学报(自然科学版), 2025, 38(01): 122-134 DOI:10.19728/j.issn1672-6634.2024080010