一种基于协同训练半监督的分类算法

王宇, 李延晖

华中师范大学学报(自然科学版) ›› 2021, Vol. 55 ›› Issue (06) : 1020 -1029.

PDF
华中师范大学学报(自然科学版) ›› 2021, Vol. 55 ›› Issue (06) : 1020 -1029. DOI: 10.19603/j.cnki.1000-1190.2021.06.011

一种基于协同训练半监督的分类算法

    王宇, 李延晖
作者信息 +

Author information +
文章历史 +
PDF

摘要

为提高少量样本情况下分类器的性能,提出一种基于多分类器协同的半监督样本选择方法,利用未标注样本实现样本增强,提高分类器泛化能力.依靠多分类器的互相监督和多分类器标签一致的原理,将已标记样本作为训练集,利用SVM和RF两个分类器协同训练,多分类器的类别标签和确定度值作为约束条件,从未标记样本集中筛选出最有代表性的样本构成增强样本集,以准确率为评价标准,验证本算法对分类器泛化性能的影响.本算法在手写数字数据集(Mnist字符库)和Landsat土壤数据集上测试,实验结果表明相比少量原始训练样本构建的分类器,增强样本构建分类器预测的全部类别准确率都得到提升.两个数据集的总体准确率分别提升5.97%和7.02%,Mnist数据集中数字5这类准确率提升最高(提升11.9%,从79.3%到91.2%),Landsat土壤数据集中土壤3这一类准确率提升最明显(提升15.8%,从73.5%到89.3%),结果证明了该算法显著提高了分类器的泛化性能.同时与经典的KNN、Co-training和Co-forest算法对比,所提出的算法能够最大限度地利用未标记样本信息,具有最好的精度表现,证明了该研究提出算法的优越性.

关键词

半监督学习 / 协同训练 / 支持向量机 / 随机森林 / 样本增强

Key words

引用本文

引用格式 ▾
一种基于协同训练半监督的分类算法[J]. 华中师范大学学报(自然科学版), 2021, 55(06): 1020-1029 DOI:10.19603/j.cnki.1000-1190.2021.06.011

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

92

访问

0

被引

详细

导航
相关文章

AI思维导图

/