基于深度卷积神经网络的端到端语音识别方法研究

李瑾辉, 张国梁, 苏杨, 朱晓鸿, 王鑫

自动化技术与应用 ›› 2024, Vol. 43 ›› Issue (06) : 55 -59.

PDF
自动化技术与应用 ›› 2024, Vol. 43 ›› Issue (06) : 55 -59. DOI: 10.20033/j.1003-7241.(2024)06-0055-05

基于深度卷积神经网络的端到端语音识别方法研究

作者信息 +

Author information +
文章历史 +
PDF

摘要

端到端语音处于直接通信环境,缺少加密过程,语音信息传输过程中存在一定的干扰,导致信号特征提取较为困难,为此提出基于深度卷积神经网络的语音识别方法的研究。首先基于尺度噪声能量估计方法完成语音去噪处理;其次,通过聚合经验模态分解方法提取语音特征信息;最后,使用残差网络优化深度卷积神经网络模型,并完成端到端的语音识别。实验结果表明,所提方法在无噪声添加和有噪声添加的情况下,端到端语音识别词错率最大值分别为10%、12%,表明该方法能够高效、准确实现端到端语音识别,具有较高的实际应用价值。

关键词

语音识别 / 语音去噪 / 端到端 / 深度卷积神经网络 / 聚合经验模态分解

Key words

引用本文

引用格式 ▾
李瑾辉, 张国梁, 苏杨, 朱晓鸿, 王鑫. 基于深度卷积神经网络的端到端语音识别方法研究[J]. 自动化技术与应用, 2024, 43(06): 55-59 DOI:10.20033/j.1003-7241.(2024)06-0055-05

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

18

访问

0

被引

详细

导航
相关文章

AI思维导图

/