PDF
摘要
在偏标记学习问题中,每个样本都有一个对应的候选标签集,而其中只有一个标签是真实的标签,其余标签为伪标签,如何利用标签不确定的数据训练得到稳定的分类模型是偏标记学习的主要研究任务。为了解决偏标记学习领域标签信息未得到充分利用的问题,提出一种改进特征引导消歧的偏标记学习算法。通过最小二乘法计算特征之间的相似程度,利用样本与近邻样本标签的皮尔逊相关系数来确定样本之间的相似程度,并确定一个样本间的综合相似度完成消歧。在分类阶段采用bagging策略来构建分类决策树,实现对数据的分类。在UCI数据集和偏标记数据集上进行实验,并与现有算法进行对比分析得出,PL-FGD算法的分类效果得到了显著提升,表明本算法有较好的性能和表现。
关键词
偏标记学习
/
消歧
/
最小二乘法
/
皮尔逊相关系数
/
集成学习
Key words
易品, 刘振丙, 殷建华
改进特征引导消歧的偏标记学习算法[J].
桂林电子科技大学学报, 2021, 41(04): 312-319 DOI:10.16725/j.cnki.cn45-1351/tn.2021.04.009