PDF
摘要
投影寻踪是通过寻找最能反映原高维数据的结构或特征的投影方向,把高维数据投影到低维子空间上,从而实现在低维空间上研究分析高维数据的目的。针对文本分类中维数灾难问题,采用投影寻踪模型,将高维的文本数据降到超低维。投影寻踪的关键是构造能够找到最佳投影方向的有效算法,本文根据免疫进化的思想提出了免疫进化的投影寻踪模型,该模型能有效地寻找最佳的投影方向。将该方法应用于Reuters-21578文档集和复旦文档集,实验结果表明此方法不仅能有效解决文本分类中难数灾难问题,而且得到了很好的分类性能。
关键词
免疫进化算法
/
投影寻踪
/
投影方向
/
文本分类
Key words
免疫进化的投影寻踪模型在文本分类中的应用[J].
广西师范大学学报(自然科学版), 2011, 29(01): 123-128 DOI:10.16088/j.issn.1001-6600.2011.01.018