PDF
摘要
针对智能机电设备大数据故障预测依赖足量标签样本的问题,提出一种基于独立森林改进梯度提升树的半监督学习算法。通过独立森林算法基于少量标签样本的学习结果对无标签数据进行评估和推断标签,并使用梯度提升树算法基于新标签的数据集训练模型用于故障预测,从而减少缺乏标签对预测模型精度的影响。为了处理海量数据,在Spark大数据平台上实现了算法的并行化。实验结果表明,该方法在公开运行数据集和真实机电设备数据集的测试中提高了分类精度,具有良好的少量标签适应性和并发性能。
关键词
大数据
/
故障预测
/
少量标签
/
独立森林
/
梯度提升树
Key words
少量标签机电设备大数据故障预测方法[J].
桂林电子科技大学学报, 2020, 40(04): 292-299 DOI:10.16725/j.cnki.cn45-1351/tn.2020.04.006