一种基于加权元路径增强题目相似性嵌入的知识追踪方法技术

技术编号:38349376 阅读:11 留言:0更新日期:2023-08-02 09:29
本发明专利技术涉及知识追踪技术领域,尤其涉及一种基于加权元路径增强题目相似性嵌入的知识追踪方法,包括:建立加权异构信息网络,构建所述加权异构信息网络的元路径;通过有偏随机游走算法对题目节点进行采样,输出不同的题目节点序列,移除非题目节点;通过嵌入算法获取题目的特征向量,输出题目嵌入;融合当前时刻的题目嵌入和答题正确性向量获取输入向量,输出更新后当前时刻的知识状态向量;预测学习者正确回答下一道题目的概率。本发明专利技术利用各种关系提取题目之间的多维和高阶相似语义从而得到更优质的题目表示方法,从而挖掘到更高阶且更准确的题目相似性进而缓解答题信息不足的问题,且有利于提升知识追踪模型的预测性能。且有利于提升知识追踪模型的预测性能。且有利于提升知识追踪模型的预测性能。

【技术实现步骤摘要】
一种基于加权元路径增强题目相似性嵌入的知识追踪方法


[0001]本专利技术涉及知识追踪
,尤其涉及一种基于加权元路径增强题目相似性嵌入的知识追踪方法。

技术介绍

[0002]知识追踪(Knowledge Tracing,KT)是学习者建模的关键技术,知识追踪旨在动态追踪学生对知识的掌握情况,并根据其历史学习序列预测未来的表现,使得学生可以根据自己的弱点进行有选择性的练习来提高学习效率,从而避免盲目练习题目;让教师可以为学生提供个性化/针对性的辅导,在有效的时间内更好的学生解决问题,提高教学效率;通过在线学习系统可以为学生推荐个性化/针对性的学习资源。此外,知识追踪技术已应用于学习理论的发现和验证、题目属性(例如难度)的评估、知识结构挖掘和学习路径规划等任务。因此,知识追踪为实现大规模个性化学习提供了重要的技术基础,具有重要的社会价值和研究意义。
[0003]早期的深度知识追踪模型没有专门设计的题目表示模块,而是使用独特的技能编号(skill id)独热编码作为题目的表示,对于多技能题目,使用了将多个技能组合成一个新的组合技能的策略;通过使用多热编码可以更好地表示多技能题目,然而这类题目方法使用布尔稀疏表示,无法包含题目之间的丰富信息。
[0004]目前,为了缓解学生与题目交互数据比较稀疏的问题,部分方法在知识追踪模型中引入了题目相似性,其基本假设是同一学生正确回答相似题目的概率呈正相关且接近,因此模型可以通过利用类似题目的交互历史记录对当前题目做出更准确的预测。然而这类模型倾向于考虑特定关系来挖掘题目相似性,获取的题目相似性不准确,仅仅考虑了题目与技能掌握的关系,不能在在知识追踪建模中充分利用结构信息、属性信息等现有信息来挖掘题目相似性,也无法自适应地融合多维相似性语义,导致语义单一化且受限制,无法根本性解决数据稀疏性问题。另外,大部分方法关注点在于计算相似度得分,而不是得到一个更好的相似性嵌入,例如对于不是同一个学生回答的两个题目,相似性得分是0,导致忽略了题目间可能存在的相似性关系,不能更准确地为教师的教学/学生的学习提供有效的高效的指导。

技术实现思路

[0005]本专利技术提供一种基于加权元路径增强题目相似性嵌入的知识追踪方法,用以解决上述现有技术中的缺陷,本专利技术利用各种关系提取题目之间的多维和高阶相似语义从而得到更优质的题目表示方法,从而挖掘到更高阶且更准确的题目相似性进而缓解答题信息不足的问题。
[0006]本专利技术提供一种基于加权元路径增强题目相似性嵌入的知识追踪方法,包括:
[0007]根据学习者与题目的交互关系建立加权异构信息网络;基于所述加权异构信息网络中的实体类型和实体间的关系,以答题正确率和题目难度为边权重构建所述加权异构信
息网络的元路径;
[0008]基于所述元路径,在所述加权异构信息网络上通过有偏随机游走算法对题目节点进行采样,输出不同的题目节点序列,移除非题目节点;
[0009]根据处理后的所述题目节点序列,通过嵌入算法获取题目的特征向量,并将不同元路径下的特征向量进行融合,输出题目嵌入;
[0010]融合当前时刻的题目嵌入和答题正确性向量获取输入向量,将输入向量和上一时刻的学生状态向量作为序列模型的输入,输出更新后当前时刻的知识状态向量;
[0011]输入当前时刻的知识状态向量和下一时刻对应的题目嵌入,通过多层感知机拟合,预测学习者正确回答下一道题目的概率。
[0012]进一步,所述加权异构信息网络中的实体类型包括学生、题目、技能、模板、学生类别实体和技能类别实体,实体间的关系包括学生

题目、学生

学生类别实体、题目

模板、题目

技能以及技能

技能类别实体;
[0013]其中,创建所述学生类别实体和所述技能类别实体包括:
[0014]基于学习者对题目集合的答题情况获取学生技能矩阵,矩阵中每个元素为学生回答与技能有关的题目的正确率和错误率之间的差值,将矩阵中的行向量和列向量分别作为学生特征向量和技能特征向量;通过K

means算法为每个学生和每个技能分别指定对应的学生类别标签和技能类别标签。
[0015]进一步,以答题正确率和题目难度为边权重构建所述加权异构信息网络的元路径,包括题目

学生

题目、题目

技能

题目、题目

学生

学生类别实体

学生

题目、题目

技能

技能类别实体

技能

题目以及题目

模板

题目。
[0016]可选的,通过基于边权重的有偏随机游走,对题目节点进行采样,输出不同的题目节点序列,移除非题目节点,具体包括步骤:
[0017]对于加权异质图G=(V,E,W);
[0018]元路径ρ:
[0019]根据以下转移概率公式生成游走序列:
[0020][0021]移除所述游走序列中的非题目节点;
[0022]其中,V为节点集合,E为边集合,W为权值集合,A
n
为实体类型,δ
n
(R
n
)为关系R
n
上的属性值,a
t+1
为所述游走序列中的第t+1个节点,x是图上节点,是节点v的类型为A
t+1
的一阶邻居集合;
[0023]x
*
和v
*
分别表示在长度为l+1的元路径ρ下与节点x和v对称的已采样节点,w
v,x
∈δ
t
(R
t
)是节点v和x之间边上的权重,则D
t
是δ
t
(R
t
)的最大值和最小值的差值。
[0024]可选的,通过考虑中间节点属性的有偏随机游走,对题目节点进行采样,输出不同的题目节点序列,移除非题目节点,包括:
[0025]在采样节点序列时,分别以每个题目节点为起始节点进行若干次随机游走,在两个不同的元路径之间,基于学生能力、题目区分度、技能粒度三个中间属性引导有偏随机游走;
[0026]每次随机游走均按指定的元路径进行循环采样,直到采样的题目节点序列达到预设长度;
[0027]去除采样的题目节点序列中的非题目节点。
[0028]进一步,根据处理后的所述题目节点序列,通过嵌入算法获取题目的特征向量,并将不同元路径下的特征向量进行融合,输出题目嵌入,包括步骤:
[0029]对于每个题目节点,获取该题目节点在不同元路径下对应的特征向量,应用融合函数融合所述特征向量获取题目嵌入,包括:
[0030][0031]其中,题目节点在不同元路本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于加权元路径增强题目相似性嵌入的知识追踪方法,其特征在于,包括:根据学习者与题目的交互关系建立加权异构信息网络;基于所述加权异构信息网络中的实体类型和实体间的关系,以答题正确率和题目难度为边权重构建所述加权异构信息网络的元路径;基于所述元路径,在所述加权异构信息网络上通过有偏随机游走算法对题目节点进行采样,输出不同的题目节点序列,移除非题目节点;根据处理后的所述题目节点序列,通过嵌入算法获取题目的特征向量,并将不同元路径下的特征向量进行融合,输出题目嵌入;融合当前时刻的题目嵌入和答题正确性向量获取输入向量,将输入向量和上一时刻的学生状态向量作为序列模型的输入,输出更新后当前时刻的知识状态向量;输入当前时刻的知识状态向量和下一时刻对应的题目嵌入,通过多层感知机拟合,预测学习者正确回答下一道题目的概率。2.根据权利要求1所述的一种基于加权元路径增强题目相似性嵌入的知识追踪方法,其特征在于,所述加权异构信息网络中的实体类型包括学生、题目、技能、模板、学生类别实体和技能类别实体,实体间的关系包括学生

题目、学生

学生类别实体、题目

模板、题目

技能以及技能

技能类别实体;其中,创建所述学生类别实体和所述技能类别实体包括:基于学习者对题目集合的答题情况获取学生技能矩阵,矩阵中每个元素为学生回答与技能有关的题目的正确率和错误率之间的差值,将矩阵中的行向量和列向量分别作为学生特征向量和技能特征向量;通过K

means算法为每个学生和每个技能分别指定对应的学生类别标签和技能类别标签。3.根据权利要求2所述的一种基于加权元路径增强题目相似性嵌入的知识追踪方法,其特征在于,以答题正确率和题目难度为边权重构建所述加权异构信息网络的元路径,包括题目

学生

题目、题目

技能

题目、题目

学生

学生类别实体

学生

题目、题目

技能

技能类别实体

技能

题目以及题目

模板

题目。4.根据权利要求3所述的一种基于加权元路径增强题目相似性嵌入的知识追踪方法,其特征在于,通过基于边权重的有偏随机游走,对题目节点进行采样,输出不同的题目节点序列,移除非题目节点,包括:对于加权异质图G=(V,E,W);元路径ρ:根据以下转移概率公式生成游走序列:移除所述游走序列中的非题目节点;其中,V为节点集合,E为边集合,W为权值集合,A
n
为实体类型,δ
n
(R
n
)为关系R
n
上的属性
值,a
t+1
为所述游走序列中的第t+1个节点,x是图上节点,是节点v的类型为A
t+1
的一阶邻居集合;x
*
和v
*
分别表示在长度为l+1的元路径ρ下与节点x和v对称的已采样节点,w
v,x
∈δ
t
(R
t
)是节点v和x之间边上的权重,D
t
是δ
t
(R
t
)的最大值和最小值的差值。5.根据权利要...

【专利技术属性】
技术研发人员:孙建文刘三女牙汪兵杜尚恒
申请(专利权)人:华中师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1