基于时空图卷积网络的智能学习诊断模型

王志锋 ,  沈嘉良 ,  侯玉林 ,  严文星 ,  罗恒 ,  左明章

华中师范大学学报(自然科学版) ›› 2025, Vol. 59 ›› Issue (05) : 730 -742.

PDF (1934KB)
华中师范大学学报(自然科学版) ›› 2025, Vol. 59 ›› Issue (05) : 730 -742. DOI: 10.19603/j.cnki.1000-1190.2025.05.008
智汇前沿专题

基于时空图卷积网络的智能学习诊断模型

作者信息 +

Intelligent learning diagnostics based on spatio-temporal graph convolutional networks

Author information +
文章历史 +
PDF (1979K)

摘要

智能学习诊断是智慧教育平台中的核心任务,它通过分析学习者的答题记录来评估并预测其知识状态,实现个性化学习支持.然而,现有模型往往忽略答题序列中的知识结构信息,无法将学习状态细化至各个知识点,也难以揭示知识掌握的传播路径.针对上述不足,本文提出了一种基于时空图卷积网络的智能学习诊断模型:首先融入学科知识结构,将知识点视为相互关联的节点;然后利用时空图卷积网络同时建模答题记录的时序特性与知识结构的空间特性,动态刻画学习者知识状态的演变过程;最后生成具有更好可解释性和更高精度的诊断结果.实验证明,所提模型在三个真实数据集上的诊断性能显著优于现有主流模型.

Abstract

Intelligent learning diagnosis is a core task in smart education platforms, which evaluates and predicts learners’ knowledge status by analyzing their question-answer records to achieve personalized learning support. However, existing methods often ignore the knowledge structure information in the question-answer sequence, fail to refine the learning status to individual knowledge points, and are difficult to reveal the propagation path of knowledge mastery. To address the above shortcomings, this paper proposes an intelligent learning diagnosis method based on spatio-temporal graph convolutional network: firstly, it integrates the knowledge structure of the discipline, and treats the knowledge points as interrelated nodes; then, it uses the spatio-temporal graph convolutional network to model the temporal characteristics of the question-answer record and the spatial characteristics of the knowledge structure, and dynamically portrays the evolution of the learner’s knowledge state; finally, it generates diagnostic results with better interpretability and higher accuracy. Finally, we generate diagnostic results with better interpretability and higher accuracy. Experiments show that the diagnosis performance of the proposed method on the three real data sets is significantly better than the existing mainstream models.

Graphical abstract

关键词

智慧教育 / 人工智能 / 学习诊断 / 图卷积网络 / 可解释性

Key words

smart education / artificial intelligence / learning diagnostics / graph convolutional networks / interpretability

引用本文

引用格式 ▾
王志锋,沈嘉良,侯玉林,严文星,罗恒,左明章. 基于时空图卷积网络的智能学习诊断模型[J]. 华中师范大学学报(自然科学版), 2025, 59(05): 730-742 DOI:10.19603/j.cnki.1000-1190.2025.05.008

登录浏览全文

4963

注册一个新账户 忘记密码

随着信息技术的飞速演进,智慧教育已成为推动教育变革与高质量发展的核心驱动力.智慧教育不仅聚焦教学资源的数字化与管理的智能化,更通过数据驱动落地“因材施教”理念1.在此背景下,如何深度挖掘与利用学生学习过程中的行为数据,进而为其提供个性化、精准化的学习支持,已成为该领域的重要课题2.为实现智慧教育的全面应用,智能导学系统应运而生3.智能导学系统基于学生的学习行为、知识掌握水平和认知能力,动态调整学习路径、推荐适切资源并制定学习计划,从而持续优化个性化学习体验4.
在智能导学系统的发展进程中,学习诊断技术因其对学习状态精准评估的核心价值而备受关注5.学习诊断旨在基于学习者的答题记录或交互行为,推断其对各知识点的掌握程度,为个性化教学干预提供科学依据6.近年来,随着深度学习技术的快速发展,各类神经网络驱动的学习诊断模型层出不穷7.例如,基于循环神经网络(recurrent neural network, RNN)的模型能够捕捉答题序列中的时序依赖,刻画知识掌握的动态演进8;利用卷积神经网络构建个性化特征表示,并融入学习速度等先验信息9;通过记忆网络(memory network)对知识点层级关系进行细粒度建模10;以及借助图神经网络揭示知识点间的结构关联,构建具有语义表征的知识图谱11.这些模型在不同程度上丰富了学习诊断的模型表达能力,为智能导学系统提供了更为精准、可解释的学习诊断支持.与此同时,时空图卷积网络(spatio-temporal graph convolutional networks, STGCN)近年来在交通预测、行为识别等任务中展现出强大的序列-结构联合建模能力12,为融合时间动态与空间结构的学习状态建模提供了启发.
然而,尽管上述模型在诊断准确率方面取得了显著进展,但在实际应用中仍面临两大重要挑战.一是解释性不足.基于深度学习的智能学习诊断模型虽能提供高精度预测,却因自身“黑箱”特性难以对预测结果给出令人信服的解释,从而限制了其应用价值;二是建模维度单一.学习者的知识掌握既受到答题序列在时间维度上的动态影响,也受学科知识结构在空间维度上的约束,而现有模型往往仅聚焦于时间或空间单一维度,难以兼顾二者交互作用下知识状态变化的复杂性13.
因此,为提升智能学习诊断模型的可用性,本文结合真实学习场景与教育学理论,创新性地引入学科知识结构信息辅助建模.具体工作包括:1) 在诊断模型中融入整体知识结构视角,将知识点视为相互关联的节点,而非孤立个体,从而增强模型的实际应用价值;2) 针对学习者答题记录的时序特性与知识结构的空间特性,构建时空图卷积神经网络,对答题过程进行全维度建模,有效兼顾前后作答的时间影响和知识关联的空间影响;3) 提出一种可解释性更强的动态诊断模型,将学习状态细化至单个知识点,并实时更新学习者的知识结构,为个性化教学干预提供透明、精确的依据.

1 相关工作

1.1 智能学习诊断研究进展

基于深度学习的智能学习诊断主要体现在面向学习过程诊断的知识追踪任务中14,即通过建模学习者的答题行为序列,动态估计其对各知识点的掌握状态.2015年,Piech等15率先将RNN引入该领域,提出了首个深度知识追踪模型DKT:该模型通过RNN隐藏层表征学习者与学习资源的交互序列,不仅突破了仅依赖前一时刻状态的假设,还能捕捉长时序依赖,更真实地模拟学习者的知识演变.在 DKT 基础上,研究者围绕特征建模与个性化学习展开了大量改进工作.例如,Sun等16引入作答时间与尝试次数等先验特征,并借助自编码器对高维输入降维以提升性能;Yang等17通过决策树对学习者行为特征进行统一处理;Chen等18结合多技能信息与专家标注的技能关系图,设计了具有先验结构指导的深度知识追踪模型.与此同时,Minn等19-20提出DSCMN,通过对题目内容进行深度编码,实现个性化问题嵌入;Yeung等21在损失函数中添加正则化项,以增强模型预测的稳定性与准确性;Nagatani等22量化不同知识点间的作答时间间隔及频次,刻画遗忘效应以优化预测;Wang 等23则在模型中融合心理因素,提升对学习状态波动的刻画能力.这些模型丰富了知识追踪的建模维度,为个性化诊断提供了更强表达能力.

尽管上述模型在诊断准确率方面取得了显著进展,但在实际应用中仍面临关键挑战.首先,深度模型高度依赖隐藏向量进行状态表示,缺乏对模型内部推理机制的透明描述,难以有效解释“为何某个知识点被判为掌握/未掌握”,即所谓的“黑箱问题”.此外,大多数模型侧重于时序建模,未能显式刻画知识点之间的结构依赖,导致模型在知识层级传播路径、迁移学习能力等方面存在局限.

综上所述,基于深度学习的智能学习诊断模型在自动建模、序列预测方面展现出巨大潜力,突破了传统模型对专家标注与固定知识图的依赖.然而,这类模型仍需在两个核心问题上进一步突破.一是提升可解释性,使诊断结果可以追溯至具体的知识点与路径传播机制;二是整合时间与结构维度,实现对学习者知识状态更细粒度、更动态的建模.

1.2 图神经网络研究进展

图神经网络(graph neural network, GNN)是一类专门用于处理图结构数据的深度学习模型24.图数据由节点和边组成,每个节点携带自身特征信息,边则反映节点间的关联及其属性.由于图结构在社交网络、分子结构、知识图谱等实际场景中广泛存在且蕴含丰富的关系信息,GNN通过在节点与其邻域之间迭代传递和聚合特征,有效挖掘图中隐含的拓扑与语义模式,因而在多个领域取得了显著的研究进展和应用成果.图卷积是一种专门针对图结构数据的基本运算,而图卷积神经网络(graph convolutional neural network, GCN)则基于此运算,能够在非欧几里得空间中提取多尺度的局部结构特征并灵活组合25.

在智能学习诊断任务中,学习者的知识状态可视为其在学科知识结构图上的动态分布,该状态会随着答题与学习过程不断变化.为全面捕捉知识点间的多样关联及其相互影响,研究者们从结构化知识认知出发,将知识点视为相互联系的整体,并采用多种建模方法服务于诊断任务.Chen等18提出了PDKT-C模型,将知识点之间的先决关系建模为有序对,并假设若k₁k₂的先决知识点,则任何时刻学习者掌握k₁的概率均高于k₂.然而,该模型依赖纯人工标注,难以扩展至大规模数据集.为此,Nakagawa等26提出基于图的知识追踪模型GKT,采用端到端学习自动构建知识依赖图;Yang等27则将练习题与知识点的对应关系构建为图结构,借助GCN学习知识嵌入,并在学习诊断中用于动态更新学习者的知识图谱表示.

在这些开创性工作的基础上,研究者们进一步认识到,学生的知识结构并非一成不变,其认知状态的演化同时受到时间序列和知识结构的双重影响.因此,如何更有效地实现“时序-结构联合建模”成为图知识追踪领域的核心议题,并涌现出两大主流技术路径.一是构建动态图来捕捉知识关联的演化,二是在图模型中引入注意力机制以实现信息的动态加权.

在动态图建模方面,部分研究致力于捕捉知识图谱随学习过程的动态演变.例如,动态图知识追踪模型28将学生的学习序列视为一系列动态图快照,通过图卷积网络捕捉每个时间步下知识状态的局部依赖,并利用循环神经网络捕捉这些图快照之间的时间依赖性,从而实现了对知识结构动态变化的精细刻画.另一类工作则关注于节点状态的动态更新,如SGKT (sequential graph-based knowledge Tracing)29模型,虽然知识图结构是静态的,但它通过序列模型来聚合每个时间步由GNN提取的邻域信息,从而动态更新每个知识点的表征,有效融合了结构信息与学生的个体学习路径.

在融合注意力机制方面,研究者利用其动态加权能力来提升模型的表达力与解释性.例如,GIKT (graph-based interaction model for knowledge tracing)30在图卷积网络中引入注意力机制,可以为不同邻居知识点分配差异化权重,从而更精准地建模其对中心知识点的影响.GASKT (graph-based attentive sequential knowledge tracing)31模型在此基础上进一步扩展.一方面,它通过自注意力机制捕捉答题序列中的长距离依赖,能够更全面地反映学习者的历史学习轨迹;另一方面,它结合图注意力网络(graph attention network, GAT),在知识结构图中对不同邻居知识点的信息进行加权聚合,以突出关键性知识的作用.通过同时关注学习历史和知识结构,GASKT 能够在时间维度和结构维度上实现双重注意力建模,使得模型能够动态聚焦于对当前学习状态最具影响力的历史行为或知识关联,从而显著提升预测的灵活性与解释性.

综上所述,从静态图建模(如GKT)到动态图演化(如DGKT),再到融合注意力机制的精细化建模(如GIKT、GASKT),图神经网络在知识追踪领域展现出强大的“时序-结构联合建模”潜力.这些前沿工作极大地推动了学习诊断模型的性能和可解释性.然而,现有研究仍存在一定的局限性.一方面,部分动态图模型计算复杂度较高,难以满足实时诊断的需求;另一方面,许多模型虽然融合了时序与结构信息,但其融合方式仍较为间接,未能像交通预测等领域的时空图卷积网络(STGCN)那样,在统一的框架内实现时空特征的端到端协同学习.

因此,本研究旨在借鉴时空图卷积网络的思想,构建一个更高效、更具解释性的学习诊断模型.该模型不仅将知识结构视为一个空间图,还将学生的学习过程视为一个时间序列,通过时空联合卷积操作直接捕捉知识状态在时间和空间维度上的传播与演化规律.这有望克服现有模型在时空特征融合上的不足,从而为个性化导学提供更精准、更透明的决策依据.

2 基于时空图卷积网络的智能学习诊断模型

2.1 问题定义

智能学习诊断是以学习者行为数据为基础,评估其对各知识点的掌握程度,并提供可解释性反馈的过程;知识追踪则是其子任务之一,通常侧重于时间序列下知识状态的预测与建模.二者的主要区别在于前者更强调模型的应用目的与教育干预价值,后者则强调时序建模的技术路径.因此,本文以智能学习诊断为上位任务,结合知识追踪的建模思想,实现更加可解释的学习状态评估.该模型的任务即给定学习者时序答题记录序列:Rs=e1,a1,e2,a2,,et,at,其中,et为学习者t时刻作答的题目id,at为学习者t时刻的答题情况,at=1代表学习者在t时刻答题正确,at=0则代表答题错误,引入包含试题与知识点关联信息的Q矩阵与知识点等信息,来分析学习者对于知识点的掌握情况,并对学习者下一时刻在指定题目上的答题表现进行预测.具体来说,预测概率值yt+1=f(et+1,ht).其中,et+1为下一时刻待作答的题目,ht为通过前t步答题序列建模得到的知识状态,yt+1表示该题预测正确的概率.相关定义如下.

定义1 智能学习诊断任务. 根据学习者1:t时刻的答题记录诊断学习者在t+1时刻的知识掌握状态,以及预测其在t+1时刻的答题情况;为实现该任务目标,即在已知学习者历史行为基础上动态评估其知识状态并预测未来表现,本文设计了基于图神经网络的建模方法.

定义2 时空图卷积诊断网络. 输入学习者在一定时间步内的知识状态矩阵以及知识结构图,利用时空图卷积网络层建模跨越不同时间步、覆盖学习者整体知识结构的知识传播过程,从而更新学习者的整体知识状态Ht=[ht,1, ht,2, , ht,n],其中,n 表示知识点的总数,ht,i 表示学习者在时间t对第i个知识点的掌握程度,进而支持答题结果的预测任务.

2.2 基于时空图卷积网络的智能学习诊断模型

本文提出了一种基于时空图卷积的知识追踪模型(spatio-temporal graph convolutional knowledge tracing,STGCKT).模型包括四个部分:试题信息嵌入层、学习状态更新层、时空图卷积层和预测层.其中,试题信息嵌入层对学习者每一时刻作答的试题、试题对应的Q矩阵向量进行表示学习,得到嵌入特征向量;学习状态更新层则基于当前学习者的作答对以及在上一时刻的知识掌握状态构建长短时记忆网络层,初步更新学习者的整体知识状态;时空图卷积层对学习者的知识结构进行建模与传播,进一步更新学习者的知识掌握状态;预测层根据更新后的知识状态预测学习者下一时刻的作答结果.基于时空图卷积的智能学习诊断模型能够挖掘学习者的知识结构掌握情况以及不同时刻的知识结构掌握情况间的深度关联,并对学习者学习状态的时空特性进行有效地建模,从而预测学习者的未来学习表现并提供相应的学习指导服务.本模型的框架图如图1所示.

2.2.1 试题信息嵌入层

在线学习平台中,对学习者学习情况的一种重要的考量方式就是答题,对学习者的状态建模依赖于学习者答题过程中的各类信息,与学习者学科知识的构建息息相关的信息包括学习者作答的题目本身的信息、这些题目与知识点的关联情况、题目所包含的知识点信息等.将这些信息引入,并对其进行嵌入表征.

et表示t时刻学习者所答的题目,Q表示题目的Q矩阵,st表示t时刻所答题目相关的知识点.首先,构建试题表征网络层,对试题进行one-hot处理,由于一维离散向量相对于一维连续向量来说所携带的表征信息较为有限,所以接着训练连续嵌入矩阵Sev再对试题one-hot向量进行嵌入表示,得到试题嵌入向量:

εe,t=OneHot(et) Sev.

通常一道题目可能会包含不同的知识点,而表示题目与知识点关联的Q矩阵以0~1的形式体现了这种关联,但不同的知识点在同一道题中所占权重也有所区别,Q矩阵无法表达知识点的不同权重,因此,训练知识点权重度量向量来对知识点进行加权:

ϱq,t=Q(et) Eweight.

另外,由于知识点本身也带有不可忽略的信息,对知识点向量也进行连续嵌入表示:

vs,t=OneHot(st) Ssv.

由于嵌入过程中涉及的嵌入参数较多,容易发生参数过拟合的问题,因此本文采用Ghosh等提出的基于Rasch模型的嵌入(RME)方法来整合题目、知识点等的相关嵌入向量,RME将ϱq,t作为标量权重参数,用于控制此题目与所涵盖的知识点的偏离程度,在一定程度上减轻了模型的过度参数化和过度拟合的问题.将加权的结果与知识点的连续嵌入向量进行拼接,最后将得到的向量输入激活函数形成最终的嵌入结果:

EBE=tanhW1vs,tϱq,tεe,t+b1,

其中,SevRnum_questions×ESsvRnum_skills×E分别表示题目与知识点的连续嵌入矩阵,EweightRnum_skills×Q为知识点权重的嵌入矩阵.W1RE×Db1RE×1为激活层的权重参数与偏置参数.其算法流程如下.

2.2.2 学习状态更新层

学习是一个因人而异的过程,不同学习者的学习偏好、学习习惯、答题方式等都各有不同.因此,有必要保存每位学习者的历史答题序列并进行序列建模,对每位学习者进行个性化的序列分析.其算法流程如下.

首先,将每一时刻学习者的答题情况xt输入长短时记忆网络,接着,输入遗忘门丢弃网络中的过时信息:

ft=σWifxt+bif+Whfht-1+bhf

其中,xtRs,xt=et,atht-1为学习者t-1时刻的知识掌握状态,WifWhf为遗忘门权重系数,bifbhf为遗忘门偏置系数.

计算新的输入作答对带来的新信息,并决定新信息保留哪些部分,

it=σWiixt+bii+Whiht-1+bhi
gt=tanh Wigxt+big+Whght-1+bhg

其中,WiiWhiWigWhg为权重系数,biibhibigbhg为偏置系数.对上一时刻的信息进行有选择地遗忘或保留,同样地,对当前时刻的信息也进行遗忘和相应的保留操作,并将两部分相加:

ct=ftct-1+itgt.

经过当前作答对的输入之后,可以得到该层的输出,以及当前时刻的学习者知识掌握状态ht

ot=σWioct+bio+Whoht-1+bho
ht=ottanh ct

其中,WioWho为权重系数,biobho 为偏置系数.

2.2.3 时空图卷积层

时空图卷积网络的核心在于对预定义的图结构进行特征传播,因此,本节首先需要构建能够反映知识点间关联的知识结构图.不同于依赖领域专家手动标注先决关系的方法,本文采用一种数据驱动的策略,从全体学习者的历史答题记录中自动挖掘知识间的关联强度.

具体的,基于一个核心假设:大规模学习行为数据中知识点的连续作答模式,能够在统计意义上反映知识间的内在联系或教学安排上的前后顺序.因此,通过统计所有学习者答题序列中知识点的成对转移频率来构建图的邻接矩阵.若学习者在 t 时刻回答了涉及知识点 i 的题目,并紧接着在 t+1时刻回答了涉及知识点 j 的题目,则将其视为一次由 ij 的有效转移.

基于此,首先构建知识点结构图的邻接矩阵A,其元素 Aij 定义为知识点 ij 的转移概率:

Aij=cijk=1Kcik

其中,cij 为在整个数据集中,从知识点 i 直接转移到知识点 j 的总次数;分母 k=1Kcik 则是从知识点 i 转移到其他任意知识点 k 的总次数.通过这种方式构建的邻接矩阵A,能够从数据中学习到知识点之间的统计关联强度,为后续的空间特征传播提供依据.

对知识结构图邻接矩阵进行标准化,首先向A中添加单位矩阵,然后引入度矩阵D,对A进行归一化,让A中的每一行元素相加起来和为1得到标准化的知识结构图邻接矩阵:

A'=A+I
A¯=D-12A'D-12.

学习者的知识状态既受到答题序列在时间维度上的前后影响,也受到学科知识结构的空间约束.然而,传统图卷积通常是逐时间步处理的,无法在多个时间步上捕捉知识状态的连续演化.因此本文引入时空图卷积网络(ST-GCN)对学习状态进行联合建模.ST-GCN 模型将学习者在连续时间步上的知识状态张量作为输入,构建时空图卷积层,每个层由以下三个部分组成.

1) 时间卷积层:对输入序列在时间维度上进行一维卷积操作,形式化为:

X(t)=Conv1D(h)

其中, hRT×N×d 表示 T 个时间步上 N 个知识点的隐藏状态序列,d 为嵌入维度,时间卷积能够提取连续时间步之间的演化特征.

在本模型中,时间卷积层的卷积核大小是一个关键超参数,它决定了模型在时间维度上捕捉依赖关系的范围.参考原始ST-GCN模型及其在多个时序数据任务中的成功应用,将时间卷积核大小设定为3.这一选择主要基于以下两点考虑.

首先,在学习诊断任务中,学习者的知识状态演化具有较强的局部连续性.即,当前时刻的知识掌握情况最直接地受到其紧邻的前后几次答题行为的影响.一个较小的卷积核足以高效地捕捉这种短时序内的动态变化特征.

其次,更长期的时序依赖性可以通过堆叠多个时空图卷积层来有效捕获.每一层卷积都会在前一层的基础上扩大其时间维度上的感受野.这种设计不仅能够通过层级结构高效地建模长程依赖,还能保证模型对局部细节的敏感度,同时避免了因单层卷积核过大而导致的参数冗余与计算效率下降问题.

2) 空间图卷积层:在每一个时间步上对知识点图结构进行传播建模,图卷积操作形式为

Z(t)=σ(A¯X(t)Wc)

其中,A¯ 为归一化邻接矩阵,Wc 为第c层图卷积的权重矩阵,σ表示ReLU激活函数.该操作将不同知识点的学习状态在图结构中进行信息融合,体现知识点间的影响.

此处的归一化邻接矩阵 A¯ 直接由数据驱动生成,未对不同知识点人为设置显式的重要性权重.然而,模型通过两个层面隐式地学习和体现了知识点的重要性.

首先,在结构层面,核心知识点由于其在学科体系中的基础地位,在学习者的答题序列中会与更多其他知识点产生关联,从而在数据驱动构建的邻接矩阵 A¯ 中天然地拥有更高的连通度.这种拓扑结构上的中心性,使其在图卷积的信息传播中能够发挥更广泛的影响.

其次,在参数层面,图卷积操作中的权重矩阵 Wc 是通过模型训练端到端学习得到的.如果某些关键知识点的状态对于预测学习者的整体表现至关重要,那么模型在反向传播过程中会自适应地调整 Wc 的参数,从而在聚合邻域信息时对这些关键节点传递的特征赋予更大的权重.

综上,本模型通过结合数据驱动的图结构和任务驱动的参数自适应学习,实现了对知识点重要性的隐式建模,避免了人为定义权重可能引入的主观偏差,增强了模型的自适应性和泛化能力.

3) 后续时间卷积层:再次进行 1D 卷积以整合结构传播后的时序特征,通常带有残差连接形式:

h'=Conv1D(Z)+h

最终输出h'RT×N×d表示学习者在多个时间步上结合空间传播后的综合状态表示.

2.2.4 学习者表现预测层

整个时空图卷积学习诊断模型如下面算法所示:

对于学习表现预测层,主要包含以下四个步骤:

1) 构建总体特征向量:

Fpret=concatEBE,ht' .

2) 对总体特征向量进行z-score标准化,其中,ω为原特征向量Fpret每个维度的方差,F¯pret为原特征向量每个维度的均值:

F'pret=Fpret-F¯pretω .

3) 构建学习者答题情况预测网络:

zt=σ(Wz[hpret-1,F'pret])
rt=σ(Wr[hpret-1,F'pret])
h˜kt=tanh(Wh[rthpret-1,F'pret])
predt=σWp1h˜kt+bp1

其中,输入为经过标准化操作后的总体特征向量F'pret,输出为对学习者下一时刻的作答结果的预测值predt,其中,σsigmoid激活函数.

4) 利用交叉熵损失函数计算真实作答与预测结果之间的损失值,并使用Adam优化器更新模型参数:

      loss=-t(atlog(predt)+(1-at)log(1-      predt)).

3 实验结果与分析

本节以对学习者作答表现预测结果的准确性来对本文所提出的基于时空图卷积的智能学习诊断模型进行实验评测,采用的数据集、评价指标、参数设置等如下3.1节.

3.1 实验数据集

实验采用了三个公开的真实数据集: AICFE-MA18,ASSISTments 2009-201033,以及Statics 201134.

1) AICFE-MA18:该数据集由北京师范大学未来教育高精尖创新中心所提供,来自数学科目的在线测评数据,包含来自4 666名学生的633 970条作答记录,其中包括226个问题和31项技能(知识点),学生的平均序列长度为135.81,标准差为31.93,学生作答正确率为67.57%.此数据集采用问题标签作为模型的输入.

2) ASSISTments 2009-201033:该数据集由ASSISTments在线辅导平台提供,并已在多篇论文中用于评估智能学习诊断相关的知识追踪模型.该数据集包含4 151名学生,共有325 637条答题记录,其中包含26 688个问题和110项技能(知识点).学生的平均序列长度为78.45,标准差为155.86.该数据集的正确率为65.84%.由于大多数文献在进行实验时采用了技能(知识点)标签,因此本文在实验中对于此数据集也采用技能标签作为模型的输入.

3) Statics201134:此数据集来自一门工程静力学课程,有333名学生的189 927条答题记录,其中包含156项技能(知识点)和1 223个问题.学生的平均序列长度为568.46,标准差为370.30.该数据集的正确率为76.54%.此数据集采用问题标签作为模型的输入.

用于实验的数据集的特性统计对比如表1所示.

3.2 实验设置

3.2.1 实验环境与实验设置

本实验过程中,主要开发环境包括:Windows 10,AMD Ryzen Threadripper 2950X 16-Core Processor,32RAM,GTX 2080Ti graphics,Pytorch1.10.0,Python3.6.实验中,考虑到数据集规模大小及具体组成不同,对于数据集AICFE-MA、ASSISTments 2009-2010和Statics 2011,学生知识状态嵌入维度分别为31、110和98.三个数据集中问题嵌入及技能嵌入维度皆为60.另外,模型中的参数均采用随机初始化方法,在训练过程中,设置批处理大小为64,dropout比率为0.2,训练轮次为100.

3.2.2 对比方法

为确保实验对比的公平性与严谨性,所有对比方法的超参数设置均主要遵循其原始发表文献[15-1726-2733]中所报告的最佳配置,或参考了领域内权威综述[7, 14, 33]及公开基准中的常用设置.具体各模型的介绍及参数配置如下.

1) DKT15:DKT将RNN应用于学习者表现预测任务,以同时估计学习者对每项技能(知识点)的掌握程度.DKT用一个One-Hot向量来表示学习者对所有技能的掌握程度.实验遵循其原始论文[15]及相关基准研究714中的典型配置,设置RNN隐藏层大小为200,batch size为64,学习率为0.002,并使用Adam优化器.

2) GKT26:GKT是一种基于GNN的学习诊断模型,它采用先决关系来构建知识结构.在每个时间步,GKT将聚和邻居节点的状态以推断当前知识点下一时间步的状态,同时也更新邻居节点的状态.实验根据其原作者发布的基准26进行参数设置,选取VAE方法构建知识结构图,知识点状态嵌入大小设为32,batchsize设为32,学习率为0.005,使用Adam优化器.

3) SKT27:SKT以RNN为基础,动态建模学习者的作答表现序列,同时利用知识转移与知识共现概率来构建知识结构图以估计学习者知识掌握状态.实验参考其原始文献[27]的参数配置,batchsize设为32,知识点嵌入大小为5,学习率为0.001,使用Adam优化器.

4) DKVMN16:DKVMN是一种引入外部记忆机制的深度知识追踪模型,通过设计固定的知识点“键”表示和动态更新的“值”表示,模拟学习者对每个知识点掌握状态的演化过程.模型通过注意力机制在记忆矩阵中进行读写操作,从而对学习状态进行细粒度建模.实验中,为保证模型性能,采用其原始论文[16]推荐的参数设置,设置记忆维度为50,键值维度为100,batchsize为64,学习率为0.002,使用Adam优化器.

5) AKT32:AKT基于Transformer架构,引入自适应注意力机制对学习者作答序列进行建模,并利用位置编码强化时间信息表达.该模型能够捕捉长距离依赖,建模题目之间复杂的隐式关系.实验根据其官方实现及原文[34]中的设定,设置隐藏层维度为128,注意力头数为8,batchsize为64,学习率为0.001,使用Adam优化器.

3.2.3 评价指标

本文采用如下指标对模型进行评估:1) AUC(area under curve),当把学习者表现预测看作分类(答对或答错)任务时,采用AUC指标来评价模型性能,其定义为ROC曲线下与坐标轴围成的面积, AUC的取值范围在0.5和1之间.AUC越接近1.0,检测方法真实性越高;等于0.5时,则真实性最低,无应用价值.2) ACC(accuracy),当同时需要评估模型的全局分类精度时,采用准确率作为补充评价指标,其定义为正确预测的样本数占总样本的比例.3) RMSE(root mean squared error),当把学习者表现预测看作回归任务时,采用均方根误差RMSE作为模型性能的评价指标.RMSE指预测值与真实值之差的平方的期望值,RMSE越低,代表模型预测结果越准确,模型表现越好.三者的计算公式如下:

AUC=ipositiveClassranki-M(1+M)2M×N
ACC=i=1M+NI(predi=labeli)M+N
RMSE=1ni=1n(predi-labeli)2

其中,pred为模型预测结果,label为真实作答结果,M为数据中正样本个数,N为负样本个数,I()是指示函数(预测与标签相同时取1,否则取0),rank代表当前数与其排在前面的数能够形成多少对,如果此时是正样本,它形成的就是正序对或者“正样本-正样本”对.

3.3 实验结果及分析

3.3.1 学习者表现预测结果分析

学习诊断的一个重要任务就是对于学习者答题表现的预测结果是否准确.因此,实验首先针对本文所提出的STGCKT模型在预测学习表现方面的性能进行评估.对所有数据集,从中随机抽取75%作为训练集,25%作为测试集.基于时空图卷积的智能学习诊断模型实验结果如表2所示.

表2可以看出,STGCKT模型在AICFE-MA、ASSISTments 2009-2010、Statics 2011数据集上的AUC分别为90.8%、82.37%、83.11%,ACC分别为92.03%、84.47%、85.04%,均高于DKT等基准模型,RMSE分别为0.243 5、0.392 4、0.389 9,均低于基准模型.结果表明,在预测学习者答题表现上,STGCKT的性能优于基准模型.

同时,从表1可见,AICFE-MA 数据集的知识点数量较少(31个),结构更为清晰,同时学生答题序列较长(平均135.81条),为时空图卷积建模提供了更丰富的上下文和更明确的知识传播路径,因此 STGCKT 在该数据集上表现显著优于其他模型.而在 ASSISTments 2009-2010 和 Statics 2011 中,知识点数量庞大(分别为110和156个),答题行为更加分散,且正确率分布不均衡(Statics 2011 偏高),导致模型在建模时受到稀疏性与噪声干扰,性能提升幅度相对较小.这表明 STGCKT 的优势在于结构化程度较高、时序信息较完整的数据集场景.

另外,在实验所用的四个模型中,STGCKT、GKT和SKT的表现整体上优于DKT,这说明在根据答题情况预测作答表现的任务上,引入知识点关联信息能够提升预测的准确性.DKT使用一个单独的隐藏向量来建模学习者的整体知识状态并在每一时间步更新此状态,然后依据知识状态来判断学习者可能的作答,只考虑了作答序列间的前后关系,通过时序信息建模学习者的整体知识状态随时间的变化,而无法细化到学习者对于每一个知识点的掌握情况上,没有考虑到不同知识点间的相互影响关系.

实际场景中,在特定的学科背景下,知识点之间具有天然的关联性,因此,引入了知识结构的GKT、SKT、STGCKT模型能够对学习者的知识掌握状态在知识点层面上进行建模,并考虑了学习过程中学习者对于某一个知识点的掌握程度的变化可能会影响其对于其他相关知识点的掌握程度,更加贴合实际的学习过程.GKT通过学习者对当前知识点掌握的变化情况去更新相邻知识点的状态,SKT则通过学习一个整体的学习增量向量来模拟学习者在知识结构上的空间传播效应,进而更新学习者的整体知识状态,而STGCKT模型采用时空图卷积网络,同时建模学习过程中答题序列的时序因素与学习者知识结构的空间因素,具有更好的效果.

3.3.2 消融实验

此外,为了探究本文所使用的RME嵌入方法的有效性,使用单独的嵌入层对试题、Q矩阵、知识点进行嵌入来对比实验,对比方法如下:

vq,t=etD1
vQ,t=etD2
vS,t=StD3

其中,D1Rnum_questions×d1D2Rnum_skills×d2D3Rnum_skills×d3分别是试题、Q矩阵、知识点的嵌入矩阵.实验结果如表3所示.

由实验结果可知,相比于常规使用一个可训练的二维嵌入矩阵的嵌入方法,RME方法能够产生更好的嵌入效果,RME所设置的标量难度参数能够控制题目的嵌入向量与其所涵盖的知识点的嵌入向量之间的偏离程度,摒弃了常规嵌入方法的纯数据驱动的特性,使得题目嵌入与题目相关知识点嵌入不再是两个孤立的因素,能够在一定程度上减轻模型的过度参数化问题.

最后,为了探究时空图卷积神经网络对于学习诊断与预测任务的有效性和先进性,设置使用常规的深度神经网络来进行学习诊断与预测对比试验,即使用DNN与STGCN进行对比,实验结果如表4所示.

实验结果表明,时空图卷积网络STGCN的性能优于深度神经网络DNN,针对学习者状态建模及表现预测任务,STGCN具有更强的建模能力,可以同时建模学习者学习过程中前后答题序列间的时间影响效应与学习者的整体知识结构掌握程度间的空间影响效应,并且能够进行跨时间步的图卷积操作,而DNN则无法建模这种时空影响因子,实验结果有效地证明了STGCN的有效性.

3.3.3 学习者知识结构建模分析

除学习者表现预测之外,对于学习者知识掌握状态的建模与分析也是智能学习诊断的一个重要任务,因此,本文接下来将对学习者知识结构建模结果进行可视化分析.

本文截取了数据集AICFE-MA中一位学习者的部分答题记录数据:Rs={(k4,1),(k1,0),(k3,1),(k2,0)},取这部分题目所涉及的6个知识点,将其在STGCKT中的知识状态建模结果可视化输出.其中,这六个知识点存在的关联关系如图2所示.

截取该名学习者在四个不同时刻中关于知识点k1到k6掌握程度并输出,可以观察到尽管每一时刻学习者只作答了有关一个知识点的内容,但其知识状态的变化并不会仅仅体现在单个知识点上.具体地,从t1到t2时刻,学习者答错了k1相关题目,其在k1上的掌握程度相应地发生了下降,而k1又是k4和k5的关联知识点,因此,学习者对于k4和k5的掌握程度也有所下降.t2到tt时刻,学习者答对了k3相关的题目,而与k3相关的知识点包括k2和k6,因此学习者在k3、k2、k6上的掌握程度都有所提升.同样的,t4时刻学习者答错了k2相关知识点,在k2、k3、k6上的水平有整体性的变化.t1~t4时刻知识水平输出如图3所示.

以上过程表明,STGCKT能够不仅仅基于单点答题结果进行局部预测,而是通过图结构实现对关联知识点之间状态联动的建模,从而具备结构化可解释性.模型输出的知识状态向量变化路径可以被直观可视化,帮助教师分析“哪一题造成了哪些知识点的退化”,从而识别关键误答节点和知识传播路径.

进一步地,STGCKT的状态更新基于图卷积机制,使得知识点之间的影响关系是“可追踪、可验证”的,这相较于传统RNN类模型黑箱式隐状态表征具有更强的可解释性与教学干预价值.

4 结论

本文围绕智能学习诊断中的“时序-结构联合建模”难题,提出了一种基于时空图卷积网络(STGCKT)的学习诊断模型.该模型创新性地融合了答题序列的时间动态特征与知识点结构图的空间传播特性,并引入RME嵌入机制对题目与知识点之间的关系进行加权建模,旨在提升学习状态预测的准确性、细粒度性与可解释性.

通过在三个真实教育数据集(AICFE-MA、ASSISTments 2009-2010 和 Statics 2011)上的实验评估,STGCKT在AUC、ACC 和 RMSE 等多个指标上均显著优于DKT、GKT、SKT、DKVMN、AKT等经典模型.进一步的消融实验表明,时空图结构与RME嵌入机制是提升模型性能的关键因素.知识演化过程的可视化分析也验证了STGCKT在追踪知识点间影响路径与知识图谱动态更新方面的解释能力.

本研究的核心贡献在于:1) 在诊断模型中融入整体知识结构视角,将知识点视为相互关联的节点,而非孤立个体,从而增强模型的实际应用价值;2) 针对学习者答题记录的时序特性与知识结构的空间特性,构建时空图卷积神经网络,对答题过程进行全维度建模,有效兼顾前后作答的时间影响和知识关联的空间影响;3) 提出一种可解释性更强的动态诊断模型,将学习状态细化至单个知识点,并实时更新学习者的知识结构,为个性化教学干预提供透明、精确的依据.

此外,STGCKT在实际应用中仍存在一定局限性.首先,模型目前依赖于结构明确的 Q 矩阵来刻画题目与知识点之间的对应关系.然而,在部分真实场景中,题库未必提供完整的知识点标注.针对这一问题,可以考虑利用题目文本的语义嵌入表示(如 BERT、LLaMA 等预训练语言模型)自动生成题目间的语义图结构,再通过图聚类或关系挖掘方法推导近似的知识点依赖关系,从而替代人工标注的 Q 矩阵.其次,STGCKT 相较于 DKT 等轻量模型在计算复杂度上更高.以本文实验环境为例,STGCKT 的时空卷积层在参数规模上约为 DKT 的 1.8 倍,单批次推理时间约为其 1.5~2 倍.但得益于卷积运算的高度并行化特性,该模型在 GPU/TPU 环境下仍能满足在线教育平台的实时诊断需求.因此,STGCKT 在性能与效率之间实现了一种平衡,适合在大规模教育应用中部署.

未来研究可从以下方向展开:1) 融合大语言模型提取题目语义特征,拓展对开放题型和隐式知识点的建模能力;2) 探索图卷积与注意力机制的融合,进一步提升模型的长依赖建模效果;3) 引入非结构化数据(如回答时间、回答次数等)和多模态信息(如试题文本、试题图片)实现更全面的认知状态评估;4)推进模型在真实教学平台中的落地部署,服务个性化教学与实时干预决策.

参考文献

[1]

孙雪荧. 数字化转型何以重构智慧教育新空间[J]. 教育研究202445(4): 146-159.

[2]

SUN X Y. How digital transformation reconstructs the new space of smart education [J]. Educational Research202445(4):146-159.(Ch).

[3]

王一岩, 塔卫刚, 郑永和. “知情共育”智慧教育新范式:内涵与进路[J]. 电化教育研究202546(2): 19-25.

[4]

WANG Y YTA W GZHENG Y H. A new paradigm of smart education for the co llaborative cultivation of cognition and emotion: connotation and approach [J]. e-Education Research202546(2):19-25.(Ch).

[5]

杜修平, 王崟羽. 检索增强生成赋能智能导学系统构建研究——基于本地大模型与私有知识库[J]. 中国电化教育2025(5): 117-127.

[6]

DU X PWANG Y Y. Research on the influencing factors of teachers’ digital resource selection behavior on the national smart education platform for primary and secondary schools [J]. Instruction and Teacher Professional Development2025(5):117-127.(Ch).

[7]

LI LWANG Z. Knowledge graph-enhanced intelligent tutoring system based on exercise representativeness and informativeness[J/OL]. International Journal of Intelligent Systems2023[2025-04-08].

[8]

李振, 周东岱. 人工智能支持下基于特征融合的深度知识追踪模型研究[J]. 电化教育研究202243(4): 47-54.

[9]

LI ZZHOU D D. Research on deep knowledge tracing model based on feature fusion supported by AI [J]. e-Education Research202243(4):47-54.(Ch).

[10]

WANG ZYAN WZENG Cet al. A unified interpretable intelligent learning diagnosis framework for learning performance prediction in intelligent tutoring systems[J/OL]. International Journal of Intelligent Systems20232023(1)[2025-04-08].

[11]

刘铁园, 陈威, 常亮, . 基于深度学习的知识追踪研究进展[J]. 计算机研究与发展202259(1): 81-104.

[12]

LIU T YCHEN WCHANG Let al. Research advances in the knowledge tracing based on deep learning [J]. Journal of Computer Research and Development202259(1):81-104.(Ch).

[13]

张凯, 张慧玲, 王泽琛, . 知识点表征强化的知识追踪模型[J]. 计算机应用研究202542(1): 86-92.

[14]

ZHANG KZHANG H LWANG Z Cet al. Knowledge tracing via reinforcement of concept representation [J]. Application Research of Computers202542(1):86-92.(Ch).

[15]

LYU L, WANG ZYUN Het al. Deep knowledge tracing based on spatial and temporal representation learning for learning performance prediction[J /OL]. Applied Sciences202212(14) [2025-04-08].

[16]

YU GXIE ZZHOU Get al. Exploring long- and short-term knowledge state graph representations with adaptive fusion for knowledge tracing[J /OL]. Information Processing & Management202562(3) [2025-04-08].

[17]

WU Y QZHU HWANG C Yet al. Programming knowledge tracing based on heterogeneous graph representation[J/OL]. Knowledge-Based Systems2024300 [2025-04-08].

[18]

YAN SXIONG YLIN D. Spatial temporal graph convolutional networks for skeleton-based action recognition[C]//Proceedings of the AAAI Conference on Artificial Intelligence. New Orleans, Louisiana, USA: AAAI Press, 201832(1): 744-752.

[19]

ABDELRAHMAN GWANG QNUNES B. Knowledge tracing: a survey[J]. ACM Computing Surveys202355(11): 1-37.

[20]

王志锋, 熊莎莎, 左明章, . 智慧教育视域下的知识追踪:现状、框架及趋势[J]. 远程教育杂志202139(5): 45-54.

[21]

WANG Z FXIONG S SZUO M Zet al. Knowledge tracing from the perspective of smart education: current situation, framework and trend [J]. Journal of Distance Education202139(5):45-54.(Ch).

[22]

PIECH CBASSEN JHUANG Jet al. Deep knowledge tracing[C]//Proceedings of the 28th International Conference on Neural Information Processing Systems. Montréal, Canada: MIT Press, 20151: 505-513.

[23]

SUN XZHAO XLI Bet al. Dynamic key-value memory networks with rich features for knowledge tracing[J]. IEEE Transactions on Cybernetics202252(8): 8239-8245.

[24]

YANG HCHEUNG L P. Implicit heterogeneous features embedding in deep knowledge tracing[J]. Cognitive Computation201810(1): 3-14.

[25]

CHEN PLU YZHENG V Wet al. Prerequisite-driven deep knowledge tracing[C]//2018 IEEE International Conference on Data Mining. Singapore: IEEE, 2018: 39-48.

[26]

MINN SYU YDESMARAIS M Cet al. Deep knowledge tracing and dynamic student classification for knowledge tracing[C]//2018 IEEE International Conference on Data Mining. Singapore: IEEE, 2018: 1182-1187.

[27]

MINN SZHU FDESMARAIS M C. Improving knowledge tracing model by integrating problem difficulty[C]//2018 IEEE International Conference on Data Mining Workshops. Singapore: IEEE, 2018: 1505-1506.

[28]

KYEUNG CYEUNG D Y. Addressing two problems in deep knowledge tracing via prediction-consistent regularization[C]//Proceedings of the fifth Annual ACM Conference on Learning at Scale. London, UK: ACM, 2018: 1-10.

[29]

NAGATANI KZHANG QSATO Met al. Augmenting knowledge tracing by considering forgetting behavior[C]//The World Wide Web Conference. San Francisco, USA: ACM, 2019: 3101-3107.

[30]

WANG Z FWU W XZENG C Yet al. Psychological factors enhanced heterogeneous learning interactive graph knowledge tracing for understanding the learning process[J]. Frontiers in Psychology202415: 1664-1078.

[31]

邹慧琪, 史彬泽, 宋凌云, . 基于图神经网络的复杂时空数据挖掘方法综述[J]. 软件学报202536(4): 1811-1843.

[32]

ZOU H QSHI B ZSONG L Yet al. Survey on complex spatio-temporal data mining methods based on graph neural network [J]. Journal of Software202536(4):1811-1843.(Ch).

[33]

王博雅, 杨小春, 卢升荣, . 基于图卷积神经网络的多维度节点重要性评估方法[J]. 物理学报202473(22): 190-203.

[34]

WANG B YYANG X CLU S Ret al. A multidimensional node importance evaluation method based on graph convolutional networks [J]. Acta Physica Sinica202473(22):190-203.(Ch).

[35]

NAKAGAWA HIWASAWA YMATSUO Y. Graph-based knowledge tracing: modeling student proficiency using graph neural network[C]//IEEE/WIC/ACM International Conference on Web Intelligence. Thessaloniki, Greece: ACM, 2019: 156-163.

[36]

YANG H LHU J JCHEN J Jet al. Mahkt: knowledge tracing with multi-association heterogeneous graph embedding based on knowledge transfer[J/OL]. Knowledge-Based Systems2025310 [2025-04-08].

[37]

XIE YYANG WWEI Jet al. Domain generalizable knowledge tracing via concept aggregation and relation-based attention [DB/OL]. (2024-07-02) [2025-04-08].

[38]

WU Z YHUANG LHUANG Q Het al. SGKT: session graph-based knowledge tracing for student performance prediction[J /OL]. Expert Systems with Applications2022, 206 [2025-04-08].

[39]

YANG YSHEN JQU Yet al. GIKT: a graph-based interaction model for knowledge tracing[C]//Machine Learning and Knowledge Discovery in Databases. Cham: Springer, 2021: 299-315.

[40]

WANG MPENG CYANG Ret al. GASKT: a graph-based attentive knowledge-search model for knowledge tracing[C]//Knowledge Science, Engineering and Management. Cham: Springer, 2021: 268-279.

[41]

GHOSH AHEFFERNAN NLAN A S. Context-aware attentive knowledge tracing[DB/OL].(2020-07-24)[2025-04-08].

[42]

SHEN SLIU QHUANG Zet al. A survey of knowledge tracing: models, variants, and applications[J]. IEEE Transactions on Learning Technologies202417: 1898-1919.

[43]

SONG XLI JCAI Tet al. A survey on deep learning based knowledge tracing[J/OL]. Knowledge-Based Systems2022258 [2025-04-08].

基金资助

国家自然科学基金项目(62577027)

国家自然科学基金项目(62177022)

国家自然科学基金项目(61901165)

华中师范大学中央高校基本科研业务费(CCNU25ai011)

AI Summary AI Mindmap
PDF (1934KB)

246

访问

0

被引

详细

导航
相关文章

AI思维导图

/