基于端到端深度神经网络的语音情感识别研究

吕惠炼, 胡维平

广西师范大学学报(自然科学版) ›› 2021, Vol. 39 ›› Issue (03) : 20 -26.

PDF
广西师范大学学报(自然科学版) ›› 2021, Vol. 39 ›› Issue (03) : 20 -26. DOI: 10.16088/j.issn.1001-6600.2020051802

基于端到端深度神经网络的语音情感识别研究

    吕惠炼, 胡维平
作者信息 +

Author information +
文章历史 +
PDF

摘要

语音情感识别是实现自然人机交互的重要组成部分,传统语音情感识别系统主要集中于特征提取和模型构建。本文提出一种将深度神经网络直接应用于原始信号的语音情感识别方法。原始语音数据携带了语音信号的情感信息、二维空间信息和时序上下文信息。建立的模型以端到端的方式进行训练,网络自动学习原始语音信号的特征表示,无需手工特征提取步骤。该网络模型同时兼顾了CNN和BLSTM 2种神经网络的优点。利用CNN从原始语音数据中学习空间特征,其后添加一个BLSTM学习上下文特征。为了评估该模型的有效性,在IEMOCAP数据库上进行识别测试,获得的WA和UA分别为71.39%、61.06%。此外,与基线模型进行对比,验证了提出方法的有效性。

关键词

语音情感识别 / CNN / BLSTM / 端到端 / 原始语音

Key words

引用本文

引用格式 ▾
基于端到端深度神经网络的语音情感识别研究[J]. 广西师范大学学报(自然科学版), 2021, 39(03): 20-26 DOI:10.16088/j.issn.1001-6600.2020051802

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

97

访问

0

被引

详细

导航
相关文章

AI思维导图

/