声音事件检测综述

杨烁祯, 张珑, 王建华, 张恒远

广西师范大学学报(自然科学版) ›› 2023, Vol. 41 ›› Issue (02) : 1 -18.

PDF
广西师范大学学报(自然科学版) ›› 2023, Vol. 41 ›› Issue (02) : 1 -18. DOI: 10.16088/j.issn.1001-6600.2022083002

声音事件检测综述

    杨烁祯, 张珑, 王建华, 张恒远
作者信息 +

Author information +
文章历史 +
PDF

摘要

声音事件检测技术能够识别出一个音频段中存在的事件类别并标注出各事件的起止时间,在智能城市、医疗监控、野生动物保护等应用场景有巨大潜力,是机器听觉领域的一个重要研究课题。本文从监督学习和半监督学习2个方面对声音事件检测方法进行综述,汇总和分析现有研究中使用的特征、检测模型及其性能。对于监督学习,重点介绍机器学习方法和深度学习方法。对于半监督学习,总结基于均值教师、协同训练、多尺度卷积和注意力机制等4种有效方法。最后,介绍常用数据集和评价指标,并讨论未来可能的研究方向,包括声音分离预处理、合成数据和真实数据域适应、自注意力模型优化、特征选择和融合、流式系统建模等问题。

关键词

声音事件检测 / 机器学习 / 深度学习 / 神经网络 / 监督学习 / 半监督学习

Key words

引用本文

引用格式 ▾
声音事件检测综述[J]. 广西师范大学学报(自然科学版), 2023, 41(02): 1-18 DOI:10.16088/j.issn.1001-6600.2022083002

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

323

访问

0

被引

详细

导航
相关文章

AI思维导图

/