PDF
摘要
转辙机在工业应用中存在的大量异常数据,对其健康状态的预测造成了严重影响。传统的基于局部密度的局部异常因子算法(Local Outlierness Factor, LOF)适用于单簇数据环境,在多簇数据环境中容易将处于簇边缘的正常点判为异常点。针对这一缺陷,以铁路道岔转辙机为研究对象,选择5 000条转辙机从启动到接通的油压数据进行分析,通过引入反向k-近邻改进LOF算法,提出了一种新的基于密度的影响域异常检测算法(Influenced Outlierness, INFLO)。根据影响域离群因子的分布情况设定阈值,依据不同的k值在阈值下的异常点个数来量化并识别异常点,与传统的四分位数、 KNN和LOF算法相比,识别的异常点个数由8.92%提高到了10.6%。最后,设计了长短期记忆(Long Short-Term Memory, LSTM)网络模型,将剔除异常点后的数据点输入到网络中,与上述方法和原始数据进行对比实验来验证所提出的数据清洗方法的有效性。结果显示改进后新方法的RMSE曲线与原始数据的RMSE曲线更接近,有更好的预测效果。所提出的新方法能较好地清除转辙机油压数据集的异常值,进而提高故障检测和数据预测的性能,同时该方法对异常数据的清除效果优于其他方法。
关键词
INFLO
/
转辙机
/
数据清洗
/
异常检测
/
LSTM
Key words
基于距离密度的道岔转辙机异常检测新方法[J].
中北大学学报(自然科学版), 2025, 46(04): 517-524 DOI: