带噪声的文本聚类及其在反垃圾邮件中的应用

周鑫, 郝志峰, 蔡瑞初, 温雯

广西师范大学学报(自然科学版) ›› 2011, Vol. 29 ›› Issue (02) : 156 -160.

PDF
广西师范大学学报(自然科学版) ›› 2011, Vol. 29 ›› Issue (02) : 156 -160. DOI: 10.16088/j.issn.1001-6600.2011.02.026

带噪声的文本聚类及其在反垃圾邮件中的应用

    周鑫, 郝志峰, 蔡瑞初, 温雯
作者信息 +

Author information +
文章历史 +
PDF

摘要

本文针对垃圾邮件包含较多干扰信息,导致文档相似度度量效果较差的问题,将Needleman-Wunsch算法引入到文本相似度计算中,并针对性地提出一种高效的聚类算法,为反垃圾邮件系统提供了一种有效的垃圾邮件鉴别技术。与传统的仅基于知网、基于语义等聚类算法相比,本方法在算法效率和聚类质量上都有很大的改进。

关键词

文本相似度 / 文本聚类 / Needleman-Wunsch算法 / 垃圾邮件

Key words

引用本文

引用格式 ▾
带噪声的文本聚类及其在反垃圾邮件中的应用[J]. 广西师范大学学报(自然科学版), 2011, 29(02): 156-160 DOI:10.16088/j.issn.1001-6600.2011.02.026

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

59

访问

0

被引

详细

导航
相关文章

AI思维导图

/