虚构词搜索投毒特征检测方法研究

林晨, 邬梦莹, 管巍, 姜辉, 洪赓

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (11) : 2731 -2738.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (11) : 2731 -2738. DOI: 10.20009/j.cnki.21-1106/TP.2024-0465

虚构词搜索投毒特征检测方法研究

    林晨, 邬梦莹, 管巍, 姜辉, 洪赓
作者信息 +

Author information +
文章历史 +
PDF

摘要

搜索投毒通过不正当手段实现网站排名提升,是一种常用于搜索引擎的恶意推广行为.近年来,攻击者实施了一种利用低词频、无语义的虚构词进行恶意推广的新型搜索投毒行为.本文设计并实现了基于自然语言处理和特征识别的虚构词搜索投毒网站检测系统.该系统主要由虚构词识别和投毒特征检测模块组成.虚构词识别模块结合虚构词特性筛选网站并提取可疑虚构词.投毒特征检测模块采集网站基础设施和动态特征,利用机器学习方法训练虚构词搜索投毒网站识别模型.最后,本文利用测试集和真实世界随机样本对该系统进行有效性检验,该系统精确率达到99.92%,召回率90.63%,具备准确检测虚构词搜索投毒网站的能力.

关键词

虚构词 / 搜索投毒 / 恶意网站 / 自然语言处理 / 特征识别

Key words

引用本文

引用格式 ▾
虚构词搜索投毒特征检测方法研究[J]. 小型微型计算机系统, 2025, 46(11): 2731-2738 DOI:10.20009/j.cnki.21-1106/TP.2024-0465

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

58

访问

0

被引

详细

导航
相关文章

AI思维导图

/