低资源场景下基于联合训练与自训练的跨语言摘要方法

程绍欢, 唐煜佳, 刘峤, 陈文宇

电子科技大学学报 ›› 2024, Vol. 53 ›› Issue (05) : 762 -770.

PDF (1377KB)
电子科技大学学报 ›› 2024, Vol. 53 ›› Issue (05) : 762 -770.

低资源场景下基于联合训练与自训练的跨语言摘要方法

    程绍欢, 唐煜佳, 刘峤, 陈文宇
作者信息 +

Author information +
文章历史 +
PDF (1409K)

摘要

随着全球化的不断发展,跨语言摘要任务已成为自然语言处理领域的一项重要课题。在低资源场景下,现有方法存在表征转换受限和数据利用不充分等问题。为此,该文提出了一种基于联合训练与自训练的跨语言摘要方法。该方法使用两个模型分别建模翻译任务和跨语言摘要任务,以统一输出端的语言向量空间,从而避免模型间表征转换受限的问题。此外,通过对齐平行训练对的输出特征和概率进行联合训练,增强模型间的语义共享。同时,在联合训练的基础上引入自训练技术,利用额外的单语摘要数据生成合成数据,有效缓解了低资源场景下数据稀缺的问题。实验结果表明,该方法在多个低资源场景下均优于现有对比方法,实现了ROUGE分数的显著提升。

关键词

跨语言摘要 / 联合训练 / 低资源场景 / 机器翻译 / 自训练

Key words

引用本文

引用格式 ▾
低资源场景下基于联合训练与自训练的跨语言摘要方法[J]. 电子科技大学学报, 2024, 53(05): 762-770 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (1377KB)

135

访问

0

被引

详细

导航
相关文章

AI思维导图

/