改进卷积神经网络的单词级语音活体检测方法

李志刚, 宋晓婷, 郭琪美, 孙晓川

重庆邮电大学学报(自然科学版) ›› 2024, Vol. 36 ›› Issue (01) : 39 -48.

PDF
重庆邮电大学学报(自然科学版) ›› 2024, Vol. 36 ›› Issue (01) : 39 -48.

改进卷积神经网络的单词级语音活体检测方法

作者信息 +

Author information +
文章历史 +
PDF

摘要

为提高智能家居语音验证系统中重放语音的检测精度,提出了一种新型的单词级语音活体检测方法,采用轻量型卷积全局门控循环神经网络(light convolutional global gate recurrent neural network, LC-GGRNN)作为深度特征提取器,由支持向量机(support vector machine, SVM)执行真实和重放语音的分类,即LC-GGRNN-SVM框架。LC-GGRNN是在轻量型卷积神经网络的基础上引入了全局注意力机制和门控循环单元,前者关注提取特征的通道信息、空间信息以及通道与空间相互作用的信息,后者学习深度特征的长期相关性。提取POCO(pop noise corpus)数据集中音频文件的3种声学特征分别用于模型训练、验证和测试。结果表明,提取的伽马通频率倒谱系数声学特征在所提方法上检测效果最好,准确率、等错误率分别为85.72%、14.28%,错误接受率和错误拒绝率之和为28.59%,所提方法在POCO上的语音活体检测还具有性别依赖性。此外,所提方法对句子级重放语音检测也具有较好的泛化性。

关键词

语音活体检测 / 声学特征 / 气爆杂音 / 轻量型卷积神经网络 / 支持向量机(SVM) / POCO数据集

Key words

引用本文

引用格式 ▾
李志刚, 宋晓婷, 郭琪美, 孙晓川 改进卷积神经网络的单词级语音活体检测方法[J]. 重庆邮电大学学报(自然科学版), 2024, 36(01): 39-48 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

10

访问

0

被引

详细

导航
相关文章

AI思维导图

/