基于词替换的神经机器翻译数据增强方法

刘蓓蓓, 闫红, 李付学, 刘俊

沈阳化工大学学报 ›› 2026, Vol. 40 ›› Issue (02) : 211 -217.

PDF
沈阳化工大学学报 ›› 2026, Vol. 40 ›› Issue (02) : 211 -217.

基于词替换的神经机器翻译数据增强方法

    刘蓓蓓, 闫红, 李付学, 刘俊
作者信息 +

Author information +
文章历史 +
PDF

摘要

为解决神经机器翻译模型中某些语言对数据不足的问题,提出了一种基于单词替换的数据增强方法.首先,通过生成对应的词性文件对原数据进行处理;然后,采用单词替换算法生成新的伪单词数据,通过替换句子中的单词来扩充数据集;最后,利用反向翻译方法生成对应的译文,从而形成伪平行数据.在多个IWSLT及WMT机器翻译任务测试集上的实验结果显示:基于单词替换的数据增强方法相较于基准模型和现有翻译方法,在提高模型的翻译性能方面表现出明显的优势,所提方法在中英翻译任务上的双语评估替换值(BLEU)提高了1.68.

关键词

词替换 / 神经机器翻译 / 数据增强

Key words

引用本文

引用格式 ▾
刘蓓蓓, 闫红, 李付学, 刘俊. 基于词替换的神经机器翻译数据增强方法[J]. 沈阳化工大学学报, 2026, 40(02): 211-217 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/