基于泛化中心聚类的时间序列缺失数据填补方法

于艳朋, 惠向晖

吉林大学学报(理学版) ›› 2025, Vol. 63 ›› Issue (04) : 1137 -1142.

PDF
吉林大学学报(理学版) ›› 2025, Vol. 63 ›› Issue (04) : 1137 -1142. DOI: 10.13413/j.cnki.jdxblxb.2024224

基于泛化中心聚类的时间序列缺失数据填补方法

    于艳朋, 惠向晖
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对填补时间序列中的缺失值通常依赖于已有数据的预测,由于时间序列的复杂性和不确定性导致预测结果常存在误差的问题,为保证数据填补效果,提出一种基于泛化中心聚类的时间序列缺失数据填补方法.首先,计算对象与类之间、类与类之间的距离,量化数据点与聚类中心之间的相对位置关系,得到数据间的空间关系.其次,利用信息瓶颈算法对空间中的泛化中心进行聚类处理,将含有缺失数据的时间序列数据集划分到同一类中.最后,计算簇半径,对泛化中心聚类后产生的离群点数据再次进行可用、弱可用随机损坏数据划分,设置波动阈值,将位于波动阈值内的随机损坏数据与聚类中统一属性值进行字符串对比,实现时间序列缺失数据填补.实验结果表明,该方法在聚类过程中有较高的标准化互信息和命中率,在缺失数据填补时,可保证数据补齐率在80%以上,说明该方法可有效改善时间序列数据的完整性.

关键词

泛化中心聚类 / 时间序列 / 缺失数据填补 / 信息瓶颈 / 随机损坏数据 / 补齐率

Key words

引用本文

引用格式 ▾
基于泛化中心聚类的时间序列缺失数据填补方法[J]. 吉林大学学报(理学版), 2025, 63(04): 1137-1142 DOI:10.13413/j.cnki.jdxblxb.2024224

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

163

访问

0

被引

详细

导航
相关文章

AI思维导图

/