基于藏文新闻文本话题检测的聚类算法研究

曹晖, 孟祥和

华中师范大学学报(自然科学版) ›› 2014, Vol. 48 ›› Issue (01) : 37 -41.

PDF
华中师范大学学报(自然科学版) ›› 2014, Vol. 48 ›› Issue (01) : 37 -41. DOI: 10.19603/j.cnki.1000-1190.2014.01.007

基于藏文新闻文本话题检测的聚类算法研究

    曹晖, 孟祥和
作者信息 +

Author information +
文章历史 +
PDF

摘要

话题检测的提出是为了帮助人们从海量的新闻报道中发现未知的新话题,其中文本聚类算法的研究,是实现藏文新闻文本的话题检测技术的核心.本文提出一种聚类算法,是基于简易聚类算法的改进,首先改进了文本顺序对聚类结果产生的影响,其次通过确定种子话题,来确定话题的类别.本研究的聚类算法在较小规模的语料中比改进前源算法有一定程度的提高.本文的研究对象是藏文网站中的新闻文本.

关键词

聚类算法 / 种子话题 / 藏文新闻文本 / 话题检测

Key words

引用本文

引用格式 ▾
基于藏文新闻文本话题检测的聚类算法研究[J]. 华中师范大学学报(自然科学版), 2014, 48(01): 37-41 DOI:10.19603/j.cnki.1000-1190.2014.01.007

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

48

访问

0

被引

详细

导航
相关文章

AI思维导图

/