基于数据模糊性的PU学习研究

李婷婷, 吕佳

北京师范大学学报(自然科学版) ›› 2020, Vol. 56 ›› Issue (1) : 45 -51.

PDF
北京师范大学学报(自然科学版) ›› 2020, Vol. 56 ›› Issue (1) : 45 -51. DOI: 10.16360/j.cnki.jbnuns.2020.01.007

基于数据模糊性的PU学习研究

    李婷婷, 吕佳
作者信息 +

Author information +
文章历史 +
PDF

摘要

PU学习是指从正例样本和无标记样本中训练分类器的一种学习方法.针对传统PU学习中所含初始正例过少,难以有效地从无标记样本中选出可靠负例,且分类过程易受噪声点影响等问题.本文提出了一种基于数据模糊性来提取无标记样本中有效信息的PU学习方法:先对正例无标记样本集进行半监督聚类,选出靠近正例样本的低模糊度数据来扩充初始正例集,并选择远离正例样本的低模糊度数据作为可靠负例;再剪辑掉无标记样本中高模糊度数据;最后在扩充后的正例样本集和可靠负例集上训练分类器,对初始无标记样本集进行分类.在标准数据集上的对比实验证实了提出算法的有效性.

关键词

PU学习 / 模糊性 / 可靠负例 / 噪声点 / 分类边界

Key words

引用本文

引用格式 ▾
基于数据模糊性的PU学习研究[J]. 北京师范大学学报(自然科学版), 2020, 56(1): 45-51 DOI:10.16360/j.cnki.jbnuns.2020.01.007

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

82

访问

0

被引

详细

导航
相关文章

AI思维导图

/