基于多维特征的涉诈网站检测与分类技术研究

游畅, 黄诚, 田璇, 燕玮, 冷涛

四川大学学报(自然科学版) ›› 2024, Vol. 61 ›› Issue (04) : 33 -42.

PDF
四川大学学报(自然科学版) ›› 2024, Vol. 61 ›› Issue (04) : 33 -42. DOI: 10.19907/j.0490-6756.2024.040003

基于多维特征的涉诈网站检测与分类技术研究

    游畅, 黄诚, 田璇, 燕玮, 冷涛
作者信息 +

Author information +
文章历史 +
PDF

摘要

随着互联网的发展与普及,涉诈团伙诈骗手法与反检测技术愈发先进,涉诈网站的检测与分类对于网络空间安全重要性更加显著,而传统的检测技术已无法应对现在的新型诈骗网站,并且针对涉诈网站分类的研究很少.针对此热点难题,本文分析了当今新型涉诈网站的多个典型特征并提出了一种基于多维特征的涉诈网站检测与分类系统.该系统共构建11种涉诈网站特征与3600个网页关键词来表示一个涉诈网站.系统首先利用爬虫获取待检测域名的网页截图、WHOIS信息与源码并交给特征抽取模块构建多维特征集.检测模块提取网站域名、代码结构以及网站WHOIS信息作为特征,构建随机森林模型实现检测任务.然后基于检测结果,网页分类模块利用双向GRU提取网页的文本特征,在置信度小于0.7的情况下使用BERT模型从而保证系统准确度与效率,并使用残差神经网络提取网页截图特征,同时计算网页内部图片与网站Logo相似度,创建随机森林模型进行分类,并设计了对比实验进一步分析模型的准确性.实验证明,本文提出的模型拥有很高的准确性,模型平均F1-score达到97.28%.实验结果表明,本文提出的多维特征模型能很好地区分涉诈网站与正常网站,克服了传统方法应对新型涉诈网站的识别问题,并适用于全球新增域名的涉诈网站快速检测与分类.

关键词

涉诈网站检测 / 网站分类 / 随机森林 / 深度学习

Key words

引用本文

引用格式 ▾
基于多维特征的涉诈网站检测与分类技术研究[J]. 四川大学学报(自然科学版), 2024, 61(04): 33-42 DOI:10.19907/j.0490-6756.2024.040003

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

5

访问

0

被引

详细

导航
相关文章

AI思维导图

/