基于深度学习的钢琴自动音乐转录算法研究

高长天, 王艺博

自动化技术与应用 ›› 2026, Vol. 45 ›› Issue (05) : 148 -152.

PDF
自动化技术与应用 ›› 2026, Vol. 45 ›› Issue (05) : 148 -152. DOI: 10.20033/j.1003-7241.(2026)05-0148-05

基于深度学习的钢琴自动音乐转录算法研究

    高长天, 王艺博
作者信息 +

Author information +
文章历史 +
PDF

摘要

为了提高钢琴音乐转换的多音符转换精度,提出一种基于深度学习的钢琴自动音乐转录算法,算法创新性地结合了常数Q转换和卷积神经网络,实现音频数据的转换与检测分析。首先对钢琴音频信号进行预处理,通过常数Q转换实现时频分析,生成精准的双声道时频特征图谱;随后构建卷积神经网络模型,设计88个输出向量适配钢琴全音域音调检测;最后搭建“数据预处理-起始时间检测-结束时间检测”三级模块,实现多音调同步识别、公共起始时间对齐与帧级结束时间检测的完整转录流程。结果显示,起始时间检测单声道精确度、召回率及F1值分别为79.62%、79.64%、79.59%,双声道精确度、召回率及F1值分别为82.31%、81.99%、82.62%,双声道比单声道的音频处理性能更好;卷积层数为4的起始时间检测性能整体较好,精确度、召回率及F1值分别为0.802、0.799、0.798;该方法在不同处理数据集上表现了明显的性能优势,精确度在86%以上,明显高于其他方法,研究成果有效解决了钢琴复音转录中的时频分辨率矛盾与多音符同步识别难题,为音乐教育、创作辅助、音频检索等领域提供了高精度的技术支撑,具有良好的工程应用价值。

关键词

深度学习 / 卷积神经网络 / 钢琴 / 转录算法 / 常数Q转换 / 多音符转换

Key words

引用本文

引用格式 ▾
高长天, 王艺博. 基于深度学习的钢琴自动音乐转录算法研究[J]. 自动化技术与应用, 2026, 45(05): 148-152 DOI:10.20033/j.1003-7241.(2026)05-0148-05

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/