PDF
摘要
基于2020年中国公募基金路演视频数据,构建涵盖文本语义、语言结构及语音行为在内的多模态特征体系,并采用梯度提升回归(gradient boosting regression,GBR)模型对基金次日收益率进行预测.通过交叉验证和网格搜索优化模型参数,并与支持向量回归(support vector regression,SVR)、随机森林(random forest,RF)、拉索等方法进行对比.结果表明,GBR在预测精度上具有显著优势.借助可解释性分析,本文揭示了“模糊词汇占比”“语速”“音调变化”等关键特征对预测结果的主要贡献,印证了语言风格与表达方式在行为金融视角下对投资者判断与市场反应的潜在影响.本研究不仅拓展了多模态数据建模的应用场景,也为基金经理优化视频信息披露、投资者理解非财务信号提供了量化支持.
关键词
多模态特征
/
基金路演视频
/
收益率预测
/
梯度提升回归
/
可解释性分析
Key words
融合视频数据的梯度提升算法在基金收益率预测中的应用研究[J].
北京师范大学学报(自然科学版), 2025, 61(6): 776-785 DOI: