基于外部知识筛选的主题文本生成技术研究

王沛, 杨频, 程芃森, 代金鞘, 贾鹏

四川大学学报(自然科学版) ›› 2024, Vol. 61 ›› Issue (01) : 75 -83.

PDF
四川大学学报(自然科学版) ›› 2024, Vol. 61 ›› Issue (01) : 75 -83. DOI: 10.19907/j.0490-6756.2024.012003

基于外部知识筛选的主题文本生成技术研究

    王沛, 杨频, 程芃森, 代金鞘, 贾鹏
作者信息 +

Author information +
文章历史 +
PDF

摘要

在自然语言生成任务中,主题文本生成是一项富有挑战性的工作,其主要难点在于:源信息量远小于目标生成的信息量.为了解决该问题,本文提出一个基于外部知识筛选的主题文本生成模型Trans-K,通过引入与主题词相关的外部知识来丰富源信息,进而提高生成文本的质量.本文为了解决引入外部知识的“一词多义”问题,提出一种基于线性变换的主题向量计算方法,用于筛选和主题词语义一致的外部知识;提出一种基于注意力机制的外部权重计算方法,为每个外部词设定一个主题权重,使其更贴合文本语义;为了解决主题词(含候选词)在生成文本中反复出现的问题,提出一种基于多头注意力机制的内部权重计算方法.在EASSY数据集上的实验表明,与基线相比,Trans-K生成文本质量的各项指标更优.此外,人类评估表明,该模型可生成与主题更相关、语言更连贯、且符合语义逻辑的文本.

关键词

自然语言生成 / 主题文本生成 / Transformer / HowNet / 知识增强

Key words

引用本文

引用格式 ▾
基于外部知识筛选的主题文本生成技术研究[J]. 四川大学学报(自然科学版), 2024, 61(01): 75-83 DOI:10.19907/j.0490-6756.2024.012003

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

4

访问

0

被引

详细

导航
相关文章

AI思维导图

/