基于迁移学习的非结构化大数据缺失值插补算法

颜远海, 杨莉云

吉林大学学报(信息科学版) ›› 2024, Vol. 42 ›› Issue (02) : 372 -377.

PDF
吉林大学学报(信息科学版) ›› 2024, Vol. 42 ›› Issue (02) : 372 -377. DOI: 10.19292/j.cnki.jdxxp.2024.02.014

基于迁移学习的非结构化大数据缺失值插补算法

    颜远海, 杨莉云
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对数字信息产生的海量、多角度的非结构化大数据,由于外界干扰、数据结构损坏等因素造成其信息丢失问题,提出了基于迁移学习的非结构化大数据缺失值插补算法。通过迁移学习算法,预测非结构化大数据缺失部位,利用朴素贝叶斯算法分类数据特征,度量属性间权重值,明确数据类别特征差异向量,辨别特征差异程度。采用核回归模型对数据缺失部分实施非线性映射,经过多项式变化编码,描述数据的跨空间互补条件,完成非结构化大数据缺失值插补。实验结果表明,所提算法可以有效完成非结构化大数据缺失值插补,具有较好的插补效果,能提高插补精度。

关键词

迁移学习 / 非结构化大数据 / 缺失值插补 / 缺失值预测 / 核回归函数

Key words

引用本文

引用格式 ▾
基于迁移学习的非结构化大数据缺失值插补算法[J]. 吉林大学学报(信息科学版), 2024, 42(02): 372-377 DOI:10.19292/j.cnki.jdxxp.2024.02.014

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

91

访问

0

被引

详细

导航
相关文章

AI思维导图

/