当前位置: 首页 > 专利查询>广西大学专利>正文

基于行为感知的知识追踪方法及系统技术方案

技术编号:38151784 阅读:15 留言:0更新日期:2023-07-13 09:16
本发明专利技术公开了一种基于行为感知的知识追踪方法及系统,方法包括以下步骤:构建知识追踪模型,所述知识追踪模型将学生的在线教育数据中的目标信息进行嵌入表示,然后根据学生的在线教育数据感知学生的做题行为状态,并根据目标信息的嵌入和学生的做题行为状态建模学生答题过程中的学习收益和遗忘影响,最后根据学习收益和遗忘影响下的学生当前知识状态预测学生在下一次练习中的表现;对所述知识追踪模型进行训练,将学生的在线教育数据输入训练好的知识追踪模型,得到学生在下一次练习中表现的预测结果。本发明专利技术充分关注学生在不同做题行为状态下的知识收益,从而保持知识追踪中学生学习过程的一致性。生学习过程的一致性。生学习过程的一致性。

【技术实现步骤摘要】
基于行为感知的知识追踪方法及系统


[0001]本专利技术涉及人工智能领域,尤其涉及一种基于行为感知的知识追踪方法及系统。

技术介绍

[0002]知识追踪(Knowledge Tracing,KT)是智能辅导系统(Intelligent Tutoring Systems,ITSs)中的一项具有挑战性的任务,旨在根据学生的习题作答情况来预测他们的知识状态,为智能辅导系统的个性化学习功能提供了基础和关键的支持。更具体地说,KT能够根据学生的历史学习记录,输出学生正确回答下一个新问题的概率。基于这些计算的概率,ITS能够向知识熟练程度不同的学生提供个性化的教育,如推荐合适难度的习题,从而提高学生的学习效率。
[0003]由于知识追踪的重要性,研究人员提出了各种KT模型来解决这一问题。早期的工作利用贝叶斯理论建立了贝叶斯知识追踪(Bayesian Knowledge Tracing,BKT)。随后,一些研究者利用性能因子分析(Performance Factor Analysis,PFA)策略来实现相同的知识追踪功能。随着深度学习的快速发展,研究人员提出了一系列的深度KT模型,这些模型利用深度神经网络来预测学生的知识状态,预测效果有了很大的提升,取得了更高的准确性。
[0004]然而,这些知识追踪模型大都基于一个假设:当学生答对或者答错一道习题时,习题相应知识概念掌握程度会相对地增加或减少,这显然与教育认知理论不一致。因为在实际学习过程中,学生也可以从错误中学习到知识。针对该不足,Shen等人提出了LPKT模型,其认为无论学生做题正确与否,学生都能从中学到知识使得知识状态相应地提高。但是,这与实际情况并不相符,因为其忽视了一个问题:在教育心理学中,学生做题时的行为状态可以分为快速猜测行为(Rapid

Guessing Behavior,RGB)和解决行为(Solution Behavior,SLB)且大量实验证明,在快速猜测行为下学生是不能从所答习题中获得学习收益的。进一步说,如果学生没有认真答题,纯属靠猜测蒙题,那么无论答题对错可能都不会帮助学生提升知识水平。因此,在建模学生学习过程时,需要对学习的行为状态进行感知,并以此分析学生是否能从做题中获得学习收益。
[0005]针对以往KT研究的不足:未考虑到学生在实际做题过程中具有不同的行为状态,不同的行为状态下会有不同的学习收益,亟需一种有效的方法来解决相关问题。

技术实现思路

[0006]本专利技术要解决的技术问题就在于:针对现有技术存在的技术问题,本专利技术提供一种基于行为感知的知识追踪方法及系统,充分关注学生在不同做题行为状态下的知识收益,从而保持知识追踪中学生学习过程的一致性。
[0007]为解决上述技术问题,本专利技术提出的技术方案为:
[0008]一种基于行为感知的知识追踪方法,包括以下步骤:
[0009]S1)构建知识追踪模型,所述知识追踪模型将学生的在线教育数据中的目标信息进行嵌入表示,然后根据学生的在线教育数据感知学生的做题行为状态,并根据目标信息
的嵌入和学生的做题行为状态建模学生答题过程中的学习收益和遗忘影响,最后根据学习收益和遗忘影响下的学生当前知识状态预测学生在下一次练习中的表现;
[0010]S2)对所述知识追踪模型进行训练,将学生的在线教育数据输入训练好的知识追踪模型,得到学生在下一次练习中表现的预测结果。
[0011]进一步的,步骤S1中将学生的在线教育数据中的目标信息进行嵌入表示时,包括:
[0012]S101)将同一个习题单元中的习题、答题时间和答案分别转换成相应的嵌入;
[0013]S102)融合习题嵌入、答题时间嵌入和答案嵌入,得到习题基本单元嵌入;
[0014]S103)将上一时刻的知识状态嵌入矩阵H
t
‑1与当前习题e
t
所在的Q矩阵的对应行的行向量q
et
相乘,得到当前习题e
t
的相关知识概念状态所述Q矩阵为表示习题和知识概念间的关系的二元矩阵,若习题q
M
不包含知识概念c
K
,Q矩阵中对应的元素q
MK
的值设置为一个预设的正值γ。
[0015]进一步的,步骤S102具体包括:
[0016]对当前回答的习题e
t
和之前回答的练习e
i
进行点积运算并使用softmax激活函数来计算注意力系数w
t
(i);
[0017]计算注意力系数w
t
(i)对历史回答的习题嵌入的加权,得到t时刻的习题嵌入向量;
[0018]应用多层感知器融合t时刻的习题嵌入、答题时间嵌入和答案嵌入,得到t时刻习题基本单元嵌入l
t

[0019]进一步的,步骤S1中根据学生的在线教育数据感知学生的做题行为状态时,包括:使用阈值识别法判断学生的做题行为状态,当学生在回答习题e
i
时,若其处于RGB状态,学生在第i次做题交互时的行为状态B
i
为第一值;若其处于SLB状态,学生在第i次做题交互时的行为状态B
i
为第二值。
[0020]进一步的,步骤S1中根据目标信息的嵌入和学生的做题行为状态建模学生答题过程中的学习收益和遗忘影响时,包括:
[0021]获取习题e
t
的相关知识概念状态将间隔时间嵌入it
t
连接到两个连续的习题基本单元嵌入之间,得到相关知识概念的学习收益lg
t
,表达式如下:
[0022][0023]其中为权值矩阵,为偏置项,tanh为非线性激活函数,l
t
‑1及l
t
分别为连续两个习题基本单元嵌入;
[0024]将学生当前做题时的行为状态B
t
、学习收益lg
t
以及预设的学习门F
lt
相乘得到第t次学习交互中的实际学习收益LG
t
,表达式如下:
[0025][0026]其中,O(x)=(x+1)/2是一个线性变换函数,用来将lg
t
的范围映射到(0,1),使得学习收益LG
t
不为负值;
[0027]将上一时刻知识状态嵌入矩阵H
t
‑1、当前时刻实际学习收益LG
t
、间隔时间it
t
输入预设的遗忘门F
ft
,得到遗忘影响。
[0028]进一步的,所述学习门F
lt
表达式如下:
[0029][0030]其中,为权值矩阵,为偏置项,σ为非线性sigmoid激活函数,l
t
‑1及l
t
分别为连续两个习题基本单元嵌入,it
t
为间隔时间嵌入,为习题e
t
的相关知本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于行为感知的知识追踪方法,其特征在于,包括以下步骤:S1)构建知识追踪模型,所述知识追踪模型将学生的在线教育数据中的目标信息进行嵌入表示,然后根据学生的在线教育数据感知学生的做题行为状态,并根据目标信息的嵌入和学生的做题行为状态建模学生答题过程中的学习收益和遗忘影响,最后根据学习收益和遗忘影响下的学生当前知识状态预测学生在下一次练习中的表现;S2)对所述知识追踪模型进行训练,将学生的在线教育数据输入训练好的知识追踪模型,得到学生在下一次练习中表现的预测结果。2.根据权利要求1所述的基于行为感知的知识追踪方法,其特征在于,步骤S1中将学生的在线教育数据中的目标信息进行嵌入表示时,包括:S101)将同一个习题单元中的习题、答题时间和答案分别转换成相应的嵌入;S102)融合习题嵌入、答题时间嵌入和答案嵌入,得到习题基本单元嵌入;S103)将上一时刻的知识状态嵌入矩阵H
t
‑1与当前习题e
t
所在的Q矩阵的对应行的行向量q
et
相乘,得到当前习题e
t
的相关知识概念状态所述Q矩阵为表示习题和知识概念间的关系的二元矩阵,若习题q
M
不包含知识概念c
K
,Q矩阵中对应的元素q
MK
的值设置为一个预设的正值γ。3.根据权利要求2所述的基于行为感知的知识追踪方法,其特征在于,步骤S102具体包括:对当前回答的习题e
t
和之前回答的练习e
i
进行点积运算并使用softmax激活函数来计算注意力系数w
t
(i);计算注意力系数w
t
(i)对历史回答的习题嵌入的加权,得到t时刻的习题嵌入向量;应用多层感知器融合t时刻的习题嵌入、答题时间嵌入和答案嵌入,得到t时刻习题基本单元嵌入l
t
。4.根据权利要求1所述的基于行为感知的知识追踪方法,其特征在于,步骤S1中根据学生的在线教育数据感知学生的做题行为状态时,包括:使用阈值识别法判断学生的做题行为状态,当学生在回答习题e
i
时,若其处于RGB状态,学生在第i次做题交互时的行为状态B
i
为第一值;若其处于SLB状态,学生在第i次做题交互时的行为状态B
i
为第二值。5.根据权利要求1所述的基于行为感知的知识追踪方法,其特征在于,步骤S1中根据目标信息的嵌入和学生的做题行为状态建模学生答题过程中的学习收益和遗忘影响时,包括:获取习题e
t
的相关知识概念状态将间隔时间嵌入it
t
连接到两个连续的习题基本单元嵌入之间,得到相关知识概念的学习收益lg
t
,表达式如下:其中为权值矩阵,为偏置项,tanh为非线性激活函数,l
t
‑1及l
t
分别为连续两个习题基本单元嵌入;将学生当前做题时的行为状态B
t
、学习收益lg
t
以及预设的学习门F
lt
相乘得到第t次学习交互中的实际学习收益LG
t
,表达式如下:
其中,O(x)=(x+1)/2是一个线性变换函数,用来将lg
...

【专利技术属性】
技术研发人员:许嘉黄欣悦吕品
申请(专利权)人:广西大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1