多文档短摘要生成技术研究

张随远, 薛源海, 俞晓明, 刘悦, 程学旗

广西师范大学学报(自然科学版) ›› 2019, Vol. 37 ›› Issue (02) : 60 -74.

PDF
广西师范大学学报(自然科学版) ›› 2019, Vol. 37 ›› Issue (02) : 60 -74. DOI: 10.16088/j.issn.1001-6600.2019.02.008

多文档短摘要生成技术研究

    张随远, 薛源海, 俞晓明, 刘悦, 程学旗
作者信息 +

Author information +
文章历史 +
PDF

摘要

自动摘要技术用于将较长篇幅的文章压缩为一段较短的能概括原文中心内容的文本。多文档冗余度高,电子设备所展示的空间有限,成为摘要发展面临的挑战。本文提出融合图卷积特征的句子粗粒度排序方法。首先将句子之间的相似度矩阵视为拓扑关系图,对其进行图卷积计算得到图卷积特征。然后通过排序模型融合图卷积特征以及主流的抽取式多文档摘要技术对句子进行重要度排序,选取排名前四的句子作为摘要。最后提出基于Seq2seq框架的短摘要生成模型:①在Encoder部分采用基于卷积神经网络(CNN)的方法;②引入基于注意力的指针机制,并将主题向量融入其中。实验结果表明,在本文场景下,相较于循环神经网络(RNN),在Encoder部分基于CNN能够更好地进行并行化,在效果基本一致的前提下,显著提升效率。此外,相较于传统的基于抽取和压缩的模型,本文提出的模型在ROUGE指标以及可读性(信息度和流利度)方面均取得了显著的效果提升。

关键词

多文档 / 短摘要生成 / Seq2seq

Key words

引用本文

引用格式 ▾
多文档短摘要生成技术研究[J]. 广西师范大学学报(自然科学版), 2019, 37(02): 60-74 DOI:10.16088/j.issn.1001-6600.2019.02.008

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

84

访问

0

被引

详细

导航
相关文章

AI思维导图

/