基于VMD的双通道构音障碍语音特征图谱提取算法

薛珮芸, 白静, 张楠, 赵建星

东北大学学报(自然科学版) ›› 2024, Vol. 45 ›› Issue (06) : 793 -801.

PDF (1149KB)
东北大学学报(自然科学版) ›› 2024, Vol. 45 ›› Issue (06) : 793 -801.

基于VMD的双通道构音障碍语音特征图谱提取算法

作者信息 +

Author information +
文章历史 +
PDF (1175K)

摘要

针对在提取构音障碍患者语音有效特征信息不足,导致语音识别率低的问题,提出一种基于变分模态分解(VMD)的多尺度双通道滤波器组(MBCFbank)特征图谱提取算法.首先,为了更好地提取符合人耳听觉结构特性的声学特征,提出一种双通道滤波器组(BCFbank)特征提取算法,该算法采用Mel滤波后做对数变换,同时采用Gammatone滤波后作非线性响度变换;其次,采用VMD来优化BCFbank特征,对分解后的多个语音信号分量筛选出相关系数较高的3个,分别提取其BCFbank特征及其差分特征,同时对未分解的语音信号提取BCFbank特征,从而构成MBCFbank特征图谱;最后,在双路语音识别模型上进行训练和识别.实验结果表明,基于BCFbank特征、MBCFbank特征图谱的语音识别模型准确率最高分别达到了87.82%,94.34%,优于Fbank特征的识别效果.

关键词

构音障碍语音识别 / 变分模态分解 / 卷积神经网络 / MBCFbank特征

Key words

引用本文

引用格式 ▾
薛珮芸, 白静, 张楠, 赵建星 基于VMD的双通道构音障碍语音特征图谱提取算法[J]. 东北大学学报(自然科学版), 2024, 45(06): 793-801 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (1149KB)

25

访问

0

被引

详细

导航
相关文章

AI思维导图

/