PDF
摘要
目的:通过语音分析结合机器学习及特征选择技术,筛选阿尔茨海默病(AD)发展进程中的关键声学特征,构建AD分类模型,为AD的早期筛查提供候选工具。方法:从NCMMSC2021 AD语音数据集中获取AD、轻度认知障碍(MCI)与正常老年人(HC)的语音样本,对语音样本进行数据预处理,通过OpenSmile工具包提取eGeMAPS特征集中的特征参数,利用随机森林和支持向量机(SVM)机器学习算法构建分类模型。通过Python进行特征显著性检验及特征重要性排序,运用序列前向搜索(SFS)进行特征选择,并对比特征选择前后分类模型的效能。采用准确率和受试者工作特征曲线下面积(AUC)指标进行模型分类性能评价。结果:分类模型中重要声学特征主要来源于谱斜率、共振峰、基频、响度。模型最优分类效果均来自SFS特征选择后的SVM模型,AD/MCI组识别准确度为0.926(AUC=0.974),AD/HC组识别准确率为0.875(AUC=0.956),MCI/HC组识别准确率为0.879(AUC=0.904)。结论:SVM模型性能优于随机森林模型,采用SFS进行特征选择可以有效提高模型性能,语音分析可以成为未来AD快速评估筛查的有效补充工具。
关键词
阿尔茨海默病
/
语音分析
/
随机森林
/
支持向量机
/
序列前向搜索
Key words
基于语音分析的机器学习模型识别阿尔茨海默病[J].
中国医学物理学杂志, 2025, 42(05): 685-692 DOI: