一种基于深度学习的中文生成式自动摘要方法

李维勇, 柳斌, 张伟, 陈云芳

广西师范大学学报(自然科学版) ›› 2020, Vol. 38 ›› Issue (02) : 51 -63.

PDF
广西师范大学学报(自然科学版) ›› 2020, Vol. 38 ›› Issue (02) : 51 -63. DOI: 10.16088/j.issn.1001-6600.2020.02.006

一种基于深度学习的中文生成式自动摘要方法

    李维勇, 柳斌, 张伟, 陈云芳
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对中文的象形性和结构性特点,本文提出了一种新的生成式自动摘要解决方案,包括基于笔画的文本向量生成技术和一个生成式自动摘要模型。基于笔画的文本向量方法针对组成汉字的最小粒度笔画进行编码,增强了通过Skip-Gram模型得到对应的中文词向量语义信息;然后通过对Seq2Seq模型进行优化,使用Bi-LSTM解决长序列文本信息丢失以及逆向信息的补充问题;并在编码端加入Attention机制以计算不同输入词对解码端的影响权重,在解码端加入Beam Search算法优化生成序列的流畅度。基于LCSTS数据集实验表明,本文提出的模型在中文文本摘要生成质量和可读性上有所提升。

关键词

深度学习 / 生成式自动摘要 / 笔画向量 / Seq2Seq / 注意力机制

Key words

引用本文

引用格式 ▾
一种基于深度学习的中文生成式自动摘要方法[J]. 广西师范大学学报(自然科学版), 2020, 38(02): 51-63 DOI:10.16088/j.issn.1001-6600.2020.02.006

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

98

访问

0

被引

详细

导航
相关文章

AI思维导图

/