PDF
摘要
针对使用循环神经网络对学生长序列行为数据进行特征提取存在梯度消失或者爆炸、提取长期依赖关系能力不足、深度学习模型缺乏解释归因能力等问题,提出一种面向长序列数据的空洞因果卷积(dilated causal convolution,DCC)成绩预测及分析方法。首先,采用生成对抗网络(generative adversarial network,GAN)生成符合少数类学生原始行为数据分布规律的新样本,并将新样本加入到学生数据集中以达到均衡数据集的目的;然后,提出一种基于DCC的成绩预测模型,DCC和门控循环单元(gated recurrent unit,GRU)相结合的结构提高了模型对长序列数据的依赖关系提取能力;最后,使用沙普利加性解释(Shapley additive explanations,SHAP)方法并结合三因素理论对影响学生成绩的因素进行重要性分析和解释。在公开数据集上的实验结果表明,在成绩预测任务中,提出的方法与基线方法相比在加权F1指标上提高了约6%,并进一步验证了所提方法中关键模块的有效性和模型的泛化能力。此外,通过对比优秀学生和风险学生的学习特点发现,良好的学习习惯、课堂学习的主动性以及不同行为环境等因素会对学生成绩产生重要影响。
关键词
学生成绩预测
/
空洞因果卷积(dilated causal convolution,DCC)
/
不均衡数据
/
生成对抗网络(generativeadversarial network,GAN)
/
沙普利加性解释(Shapley additive explanations,SHAP)方法
/
成绩影响因素分析
Key words
基于空洞因果卷积的学生成绩预测及分析方法[J].
北京工业大学学报, 2026, 0(3): 252-267 DOI: