PDF
摘要
目前在半监督聚类的研究中,尤其是当有类标信息的类的数量少于整个数据集的类的数量时,其聚类效果并不好。本文在现有半监督聚类技术的基础上,通过特征加权来提高同一类文档的相似性,从而得到更好的聚类效果。为了验证这一思想的有效性,实验不仅在单语言数据集上进行,还在中、英双语数据集上进行了只包含中文或英文类标时的聚类实验。实验结果表明,该方法体现出良好的性能。
关键词
部分类标信息
/
特征加权
/
多语言
/
半监督聚类
Key words
基于特征加权的半监督聚类研究[J].
广西师范大学学报(自然科学版), 2011, 29(01): 92-97 DOI:10.16088/j.issn.1001-6600.2011.01.013