基于随机森林算法的大数据异常检测模型设计

宋世军 , 樊敏

吉林大学学报(工学版) ›› 2023, Vol. 53 ›› Issue (09) : 2659 -2665.

PDF (765KB)
吉林大学学报(工学版) ›› 2023, Vol. 53 ›› Issue (09) : 2659 -2665. DOI: 10.13229/j.cnki.jdxbgxb.20220598
计算机科学与技术

基于随机森林算法的大数据异常检测模型设计

作者信息 +

Design of big data anomaly detection model based on random forest algorithm

Author information +
文章历史 +
PDF (783K)

摘要

针对大数据异常检测过程易受边缘数据的干扰,导致大数据异常检测准确率较差的问题,提出了一种基于随机森林算法的大数据异常检测模型。首先,利用改进k-means算法对大数据实行聚类处理,采用主成分分析法提取大数据特征;然后,构建基于随机森林分类器的大数据异常检测模型,将提取的特征输入到模型中,构建决策树,并通过动态更新决策树的权重值提高分类器的分类精度;最后,输出分类结果,完成大数据的异常检测。实验结果表明,本文模型的检测时间约为25 s,大数据异常检测准确率平均值为91%,误报率为4.5%。

关键词

大数据聚类 / 特征提取 / 主成分分析法 / 随机森林分类器 / 决策树 / 更新权重

Key words

big data clustering / feature extraction / principal component analysis / random forest classifier / decision tree / update weights

引用本文

引用格式 ▾
宋世军, 樊敏 基于随机森林算法的大数据异常检测模型设计[J]. 吉林大学学报(工学版), 2023, 53(09): 2659-2665 DOI:10.13229/j.cnki.jdxbgxb.20220598

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

基金资助

国家自然科学基金重大专项项目(71942006)

中铁大桥勘测设计院集团有限公司科研项目(KYL202203-0086)

AI Summary AI Mindmap
PDF (765KB)

24

访问

0

被引

详细

导航
相关文章

AI思维导图

/