PDF
摘要
在篇章神经机器翻译领域,现有模型往往未对融入的上下文信息进行有效筛选,导致噪声增加和模型性能下降.为此,论文提出了一种基于篇章上下文信息筛选(Context-Filtered Document Translation, CFDT)的机器翻译方法.该方法通过引入句内约束注意力(Intra-Sentence Constraint Attention, ISCA)和筛选注意力(Filter Attention, FA)机制,实现了对篇章上下文信息的精细化管理和有效利用.ISCA模块专注于句子内部信息,提升了模型长序列表征能力;FA模块则通过计算注意力分数和应用掩码操作,筛选出与当前词汇翻译最相关的上下文信息,从而排除了冗余和不相关信息.实验结果表明,该方法在中英和英德翻译任务中,相较于现有模型,在BLEU值上取得了显著提升,证明了上下文信息筛选在篇章级神经机器翻译中的积极作用.
关键词
篇章翻译
/
上下文筛选
/
神经机器翻译
/
注意力机制
Key words
基于上下文信息筛选的篇章级神经机器翻译[J].
昆明理工大学学报(自然科学版), 2024, 49(06): 75-85 DOI:10.16112/j.cnki.53-1223/n.2024.06.293