一种基于贝叶斯张量列分解的流数据恢复算法

黄韵宇, 冯亚妮, 廖奇峰

四川大学学报(自然科学版) ›› 2025, Vol. 62 ›› Issue (06) : 1305 -1316.

PDF
四川大学学报(自然科学版) ›› 2025, Vol. 62 ›› Issue (06) : 1305 -1316. DOI: 10.19907/j.0490-6756.240204

一种基于贝叶斯张量列分解的流数据恢复算法

    黄韵宇, 冯亚妮, 廖奇峰
作者信息 +

Author information +
文章历史 +
PDF

摘要

推荐系统、传感器网络及社交媒体中的流数据在传输存储时容易被损坏,导致数据价值降低或系统不稳定,引发不可靠的数据分析和预测,此时需要进行流数据恢复.鉴于现有基于贝叶斯方法的流数据恢复算法在提取高阶张量中信息方面存在局限,本文提出了Streaming Probabilistic Tensor Train(SPTT)分解算法.该算法将流变分贝叶斯方法和张量列(Tensor Train, TT)分解方法结合起来,通过逼近高阶流数据中的潜在结构实现高效数据恢复.SPTT为潜在因子建立了概率模型,假设TT核服从高斯分布、噪声精度服从伽马分布,并借助流变分贝叶斯方法将TT格式引入贝叶斯张量分解,进而推导出流数据更新过程中TT核的后验分布.这种贝叶斯框架不仅能够鲁棒地表示复杂多指标流数据结构,还能有效处理不确定性和噪声,使算法在恢复高阶不完整噪声型流数据时表现出色.本文使用平均场近似方法将流数据张量分解问题简化为最小化Kullback-Leibler(KL)散度,保证了算法的收敛性.仿真实验表明,SPTT的恢复精度显著优于现有的贝叶斯张量分解算法,具有显著的鲁棒性和高效性,有望成为流数据质量及完整性维护的重要工具.

关键词

流数据 / 变分推断 / 张量列分解

Key words

引用本文

引用格式 ▾
一种基于贝叶斯张量列分解的流数据恢复算法[J]. 四川大学学报(自然科学版), 2025, 62(06): 1305-1316 DOI:10.19907/j.0490-6756.240204

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

4

访问

0

被引

详细

导航
相关文章

AI思维导图

/