基于上下文信息筛选的篇章级神经机器翻译

赖华, 张元, 郭军军, 高盛祥, 余正涛

昆明理工大学学报(自然科学版) ›› 2024, Vol. 49 ›› Issue (06) : 75 -85.

PDF
昆明理工大学学报(自然科学版) ›› 2024, Vol. 49 ›› Issue (06) : 75 -85. DOI: 10.16112/j.cnki.53-1223/n.2024.06.293

基于上下文信息筛选的篇章级神经机器翻译

    赖华, 张元, 郭军军, 高盛祥, 余正涛
作者信息 +

Author information +
文章历史 +
PDF

摘要

在篇章神经机器翻译领域,现有模型往往未对融入的上下文信息进行有效筛选,导致噪声增加和模型性能下降.为此,论文提出了一种基于篇章上下文信息筛选(Context-Filtered Document Translation, CFDT)的机器翻译方法.该方法通过引入句内约束注意力(Intra-Sentence Constraint Attention, ISCA)和筛选注意力(Filter Attention, FA)机制,实现了对篇章上下文信息的精细化管理和有效利用.ISCA模块专注于句子内部信息,提升了模型长序列表征能力;FA模块则通过计算注意力分数和应用掩码操作,筛选出与当前词汇翻译最相关的上下文信息,从而排除了冗余和不相关信息.实验结果表明,该方法在中英和英德翻译任务中,相较于现有模型,在BLEU值上取得了显著提升,证明了上下文信息筛选在篇章级神经机器翻译中的积极作用.

关键词

篇章翻译 / 上下文筛选 / 神经机器翻译 / 注意力机制

Key words

引用本文

引用格式 ▾
基于上下文信息筛选的篇章级神经机器翻译[J]. 昆明理工大学学报(自然科学版), 2024, 49(06): 75-85 DOI:10.16112/j.cnki.53-1223/n.2024.06.293

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

19

访问

0

被引

详细

导航
相关文章

AI思维导图

/