可比较语料库构建及在跨语言信息检索中的应用

房璐, 葛运东, 洪宇, 姚建民

广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (03) : 126 -130.

PDF
广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (03) : 126 -130. DOI: 10.16088/j.issn.1001-6600.2010.03.022

可比较语料库构建及在跨语言信息检索中的应用

    房璐, 葛运东, 洪宇, 姚建民
作者信息 +

Author information +
文章历史 +
PDF

摘要

本文主要研究基于网络的可比较语料库的构建以及其在跨语言信息检索(CLIR)中的应用。首先从新闻网站获取新闻文本,用Lucene进行对齐,构建可比较语料库;其次,利用上下文信息从对齐的文本中抽取翻译知识;最后,用获得的翻译知识在TDT4语料上进行CLIR性能实验。实验表明,所抽取的翻译知识可以提高CLIR的性能,取得了0.272 8的MAP值,相对于基于本地词典的方法提高了35.44个百分点。

关键词

可比较语料库 / 翻译知识抽取 / 上下文向量 / 跨语言信息检索 / 查询翻译

Key words

引用本文

引用格式 ▾
可比较语料库构建及在跨语言信息检索中的应用[J]. 广西师范大学学报(自然科学版), 2010, 28(03): 126-130 DOI:10.16088/j.issn.1001-6600.2010.03.022

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

64

访问

0

被引

详细

导航
相关文章

AI思维导图

/