一种综合学习过程及题目知识点难度特征的知识追踪方法技术

技术编号:34264487 阅读:24 留言:0更新日期:2022-07-24 14:35
本发明专利技术涉及一种综合学习过程及题目知识点难度特征的知识追踪方法,属于教育信息挖掘技术领域。首先收集学习者答题数据,保留数据中每道题的做题起始时间、做题用时、学习者标识、题目涉及的知识点、题目标识、正误标签等信息,并对数据进行预处理操作,然后依据对应知识点计算出每个题目的相对难度,然后生成答题情况数据序列并存储,最后将存储的数据序列输入到深度神经网络模型中,预测学习者后续答题的情况,即预测学习者对题目涉及知识点的掌握情况。情况。情况。

A knowledge tracking method integrating learning process and difficulty characteristics of topic knowledge points

【技术实现步骤摘要】
一种综合学习过程及题目知识点难度特征的知识追踪方法


[0001]本专利技术涉及一种综合学习过程及题目知识点难度特征的知识追踪方法,属于教育信息挖掘


技术介绍

[0002]知识追踪是指根据学习者现状对学习者所具有的知识水平做出判断,以便预测学习者在未来学习中的表现。学习者在学习过程中的核心目标是记忆、理解、掌握知识,并且能够对知识做出价值判断。对知识的掌握水平的判断影响了学习者模型的准确度,进一步也影响了所受个性化学习服务的质量。有研究者提出将知识追踪的任务形式化为:在学习者的交互序列上预测下一个交互行为的表现。在深度学习不断发展的今天,不论是规模更大的知识图谱出现还是各种嵌入技术发展,利用神经网络对内容进行向量化再进行处理已经成为不可阻挡的趋势。把深度学习的方法融入到知识追踪中,以此来掌握学习者对知识的掌握,可以在构建学习者模型中表示学习者的知识状态,并作为一方面的因素对学习者的学习资源推荐起到作用。

技术实现思路

[0003]本专利技术要解决的技术问题是提供一种综合学习过程及题目知识点难度特征的知识追踪方法,在原有的学习模块中加入了知识点难度因素,并修改原有网络结构,添加知识沉淀模块进行改进,能提高预测的准确率,从而解决了现有技术中知识追踪方法预测率不高的问题。
[0004]本专利技术的技术方案是:一种综合学习过程及题目知识点难度特征的知识追踪方法,具体步骤为:
[0005]Step 1:收集学习者答题数据,对数据进行预处理操作。
[0006]Step 2:依据对应知识点计算出每个题目的相对难度。
[0007]Step 3:生成答题情况数据序列并存储。
[0008]Step 4:将存储的数据序列输入到深度神经网络模型中,预测学习者后续答题的情况。
[0009]所述Step 1具体为:
[0010]Step1.1:对收集到的数据进行筛选,保留其中做题起始时间、做题用时、学习者标识、题目涉及的知识点、题目标识和正误标签信息。
[0011]Step1.2:数据清洗,将数据中所需项缺失的行数据移除。
[0012]Step1.3:将Step1.2清洗后的数据按照答题起始时间排序。
[0013]所述Step 2具体为:
[0014]Step2.1:分别统计每个题目t对应知识点全部学习者总做题数s
t

[0015]Step2.2:分别统计每个题目t对应知识点全部学习者做题正确数c
t

[0016]Setp2.3:分别计算每个题目t对应知识点的相对难度d
t
∈[0,1]。
[0017]所述Step 3具体为:
[0018]Step3.1:把数据中题目涉及的知识点转换为题目涉及的知识点编号。
[0019]Step3.2:把数据中题目标识转换为题目编号。
[0020]Step3.3:把数据中做题用时转换为做题用时编号。
[0021]Step3.4:把数据中知识点的相对难度保留1位小数,即可把难度分为11类,即0、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1,并转换为知识点的相对难度编号。
[0022]Step3.5:按照做题顺序计算相邻两题之间的时间间隔,其中时间间隔单位为分钟,对时间间隔大的异常时间间隔进行处理,如果大于43200分钟的按43200分钟记录,并转换时间间隔编号。
[0023]Step3.6:分别统计每个答题数据t对应知识点的学习次数ns
t

[0024]Step3.7:把Step3.1至Step3.6中的全部数据按照如下形式存储,每个学习者的答题情况数据占8行,以便输入到深度神经网络模型,第1行是学习者做题数量、第2行是学习者所做题目涉及的知识点编号列表、第3行是学习者做题正误标签列表、第4是为学习者所做题目编号列表、第5行是学习者做题间隔时间编号列表、第6行是学习者做题用时编号列表、第7行是学习者所做题涉及知识点相对难度编号列表,第8行是学习者所做题目涉及知识点的学习次数的编号列表。
[0025]Step3.8:把Step3.7中的数据随机按照8∶1∶1的比例分为训练集、验证集、测试集进行存储。
[0026]Step3.9:把数据中题目涉及的知识点编号和题目编号的对应情况用键值对的形式表示出来,如题目m涉及知识点n,用{m:n}的形式表示,形成对应情况problem2skill,并进行存储。
[0027]所述Step 4具体为:
[0028]Step4.1:读取Step3中每个学习者答题情况数据,形成每个学习者s的答题情况数据序列x
s
={(p1,at1,di1,c1),it1,

,(p
t
,at
t
,di
t
,c
t
),it
t


,(p
T
,at
T
,di
T
,c
T
),it
T
},其中,(p
t
,at
t
,di
t
,c
t
)是学习者s的一个答题单元,t是时刻,T是此学习者做题数量,p
t
是学习者t时刻做的题目编号,at
t
是学习者做题目p
t
用时编号,di
t
是学习者做题目p
t
涉及的知识点的难度编号,c
t
是学习者做题目p
t
的正误标签(1为正确,0为错误),it
t
是学习者做题目p
t
到题目p
t+1
的时间间隔编号。
[0029]Step4.2:读取Step3中的数据problem2skill,形成Q矩阵,是题目和题目知识点中的关系矩阵,其中q是Q矩阵中的数据,M和N分别是题目的数量和题目涉及知识点的数量,如果一个题目m涉及知识点n,则相应的令q
mn
=1,题目m没有包含知识点n,则令q
mn
为一个较小的权重,可通过实验进行调试设置,如q
mn
=0.01。
[0030]Step4.3:构建神经网络模型,所述神经网络模型分为学习模块、遗忘模块、知识沉淀模块和预测模块四部分。
[0031]学习模块用于计算学习者答题的收益,遗忘模块用于计算学习者因时间间隔变化而产生的学习损耗,知识沉淀模块用于计算学习者因知识点学习次数增加进行知识沉淀的过程、预测模块用于预测下一题的做题情况,学习、遗忘、知识沉淀更能模拟一个学习者学习的全过程。
[0032]Step4.4:为了把Step4.1中的数据输入到深度神经网络,需要对数据进行嵌入操
作,题目编号嵌入为做题用时嵌入本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种综合学习过程及题目知识点难度特征的知识追踪方法,其特征在于:Step1:收集学习者答题数据,对数据进行预处理操作;Step2:依据对应知识点计算出每个题目的相对难度;Step3:生成答题情况数据序列并存储;Step4:将存储的数据序列输入到深度神经网络模型中,预测学习者后续答题的情况。2.根据权利要求1所述的综合学习过程及题目知识点难度特征的知识追踪方法,其特征在于,所述Step1具体为:Step1.1:对收集到的数据进行筛选,保留其中做题起始时间、做题用时、学习者标识、题目涉及的知识点、题目标识和正误标签信息;Step1.2:数据清洗,将数据中所需项缺失的行数据移除;Step1.3:将Step1.2清洗后的数据按照答题起始时间排序。3.根据权利要求1所述的综合学习过程及题目知识点难度特征的知识追踪方法,其特征在于,所述Step2具体为:Step2.1:分别统计每个题目t对应知识点全部学习者总做题数s
t
;Step2.2:分别统计每个题目t对应知识点全部学习者做题正确数c
t
;Setp2.3:分别计算每个题目t对应知识点的相对难度4.根据权利要求1所述的综合学习过程及题目知识点难度特征的知识追踪方法,其特征在于,所述Step3具体为:Step3.1:把数据中题目涉及的知识点转换为题目涉及的知识点编号;Step3.2:把数据中题目标识转换为题目编号;Step3.3:把数据中做题用时转换为做题用时编号;Step3.4:把数据中知识点的相对难度保留1位小数,即可把难度分为11类,并转换为知识点的相对难度编号;Step3.5:按照做题顺序计算相邻两题之间的时间间隔,其中时间间隔单位为分钟,对时间间隔大的异常时间间隔进行处理,如果大于43200分钟的按43200分钟记录,并转换时间间隔编号;Step3.6:分别统计每个答题数据t对应知识点的学习次数ns
t
;Step3.7:把Step3.1至Step3.6中的全部数据按照如下形式存储,每个学习者的答题情况数据占8行,以便输入到深度神经网络模型,第1行是学习者做题数量、第2行是学习者所做题目涉及的知识点编号列表、第3行是学习者做题正误标签列表、第4是为学习者所做题目编号列表、第5行是学习者做题间隔时间编号列表、第6行是学习者做题用时编号列表、第7行是学习者所做题涉及知识点相对难度编号列表,第8行是学习者所做题目涉及知识点的学习次数的编号列表;Step3.8:把Step3.7中的数据随机按照8∶1∶1的比例分为训练集、验证集、测试集进行存储;Step3.9:把数据中题目涉及的知识点编号和题目编号的对应情况用键值对的形式表示出来,如题目m涉及知识点n,用{m:n}的形式表示,形成对应情况problem2skill,并进行存储。
5.根据权利要求1所述的综合学习过程及题目知识点难度特征的知识追踪方法,其特征在于,所述Step4具体为:Step4.1:读取Step3中每个学习者答题情况数据,形成每个学习者s的答题情况数据序列x
s
={(p1,at1,di1,c1),it1,

,(p
t
,at
t
,di
t
,c
t
),it
t


,(p
T
,at
T
,di
T
,c
T
),it
T
},其中,(p
t
,at
t
,di
t
,c
t
)是学习者s的一个答题单元,t是时刻,T是此学习者做题数量,p
t
是学习者t时刻做的题目编号,at
t
是学习者做题目p
t
用时编号,di
t
是学习者做题目p
...

【专利技术属性】
技术研发人员:王俊甘健侯刘金生吴迪李子杰谢昊徐博
申请(专利权)人:云南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1