Hadoop环境下多维数据流频繁模式并行挖掘算法

范舟

吉林大学学报(信息科学版) ›› 2026, Vol. 44 ›› Issue (01) : 178 -184.

PDF
吉林大学学报(信息科学版) ›› 2026, Vol. 44 ›› Issue (01) : 178 -184. DOI: 10.19292/j.cnki.jdxxp.2026.01.027

Hadoop环境下多维数据流频繁模式并行挖掘算法

    范舟
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对多维度数据流的特性和复杂性,为充分利用并行计算资源,保证算法的可扩展性,提出Hadoop环境下多维数据流频繁模式并行挖掘算法。设计基于HDFS(Hadoop Distributed File System)和MapReduce的Hadoop数据流处理平台,提出基于特征投影和拟合的Hp Fit Stream聚类算法,利用其中的多项式拟合算法完成异常数据流处理,并通过特征投影完成处理后数据流的降维以降低计算成本。采用PFPon Can Tree算法实现在Hadoop环境下多维数据流的频繁模式并行挖掘。实验结果表明,所提方法能在有效降低计算复杂度的同时,提升算法的可扩展性以及负载均衡能力。

关键词

分布式计算 / MapReduce模型 / 特征投影 / 多项式拟合 / 频繁模式 / 并行挖掘

Key words

引用本文

引用格式 ▾
范舟. Hadoop环境下多维数据流频繁模式并行挖掘算法[J]. 吉林大学学报(信息科学版), 2026, 44(01): 178-184 DOI:10.19292/j.cnki.jdxxp.2026.01.027

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/