PDF
摘要
本文主要研究基于网络的可比较语料库的构建以及其在跨语言信息检索(CLIR)中的应用。首先从新闻网站获取新闻文本,用Lucene进行对齐,构建可比较语料库;其次,利用上下文信息从对齐的文本中抽取翻译知识;最后,用获得的翻译知识在TDT4语料上进行CLIR性能实验。实验表明,所抽取的翻译知识可以提高CLIR的性能,取得了0.272 8的MAP值,相对于基于本地词典的方法提高了35.44个百分点。
关键词
可比较语料库
/
翻译知识抽取
/
上下文向量
/
跨语言信息检索
/
查询翻译
Key words
可比较语料库构建及在跨语言信息检索中的应用[J].
广西师范大学学报(自然科学版), 2010, 28(03): 126-130 DOI:10.16088/j.issn.1001-6600.2010.03.022