类簇分布引导的标签噪声检测与清洗

姜高霞, 张妮, 王文剑

小型微型计算机系统 ›› 2026, Vol. 47 ›› Issue (2) : 326 -335.

PDF
小型微型计算机系统 ›› 2026, Vol. 47 ›› Issue (2) : 326 -335. DOI: 10.20009/j.cnki.21-1106/TP.2024-0577

类簇分布引导的标签噪声检测与清洗

    姜高霞, 张妮, 王文剑
作者信息 +

Author information +
文章历史 +
PDF

摘要

标签噪声通常会误导分类器训练并对分类性能产生负面影响.利用聚类技术可以实现类簇分布引导的标签噪声辅助检测,但存在特征语义和标签语义不一致的问题,导致噪声识别过于敏感.为了充分挖掘数据分布信息以提升噪声检测准确度,本文提出一种类簇分布引导的噪声检测与清洗方法(Cluster Distribution-Guided Label Noise Detection and Cleaning, CDGDC).该方法通过类别编码的属性增强机制实现特征语义和标签语义的自适应融合,并构造近邻特征曲线来进一步排除伪标签噪声,最后对识别出的噪声进行纠正或过滤的针对性清洗以提升数据质量.实验结果表明,所提方法在模拟和真实含噪数据集上能够准确识别标签噪声,并有效提高了分类器泛化性能.

关键词

标签噪声 / 类簇分布 / 语义一致性 / 噪声检测与清洗 / 泛化性能

Key words

引用本文

引用格式 ▾
类簇分布引导的标签噪声检测与清洗[J]. 小型微型计算机系统, 2026, 47(2): 326-335 DOI:10.20009/j.cnki.21-1106/TP.2024-0577

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/