基于深度项目反应理论的认知诊断方法技术

技术编号:22387418 阅读:27 留言:0更新日期:2019-10-29 06:31
本发明专利技术公开了一种基于深度项目反应理论的认知诊断方法,包括:获取学生的历史习题数据;对历史习题数据进行预处理,使用深度学习方法并结合预处理结果对学生和习题数据进行建模,获得学生的潜在特质、以及习题难度和区分度;根据学生的潜在特质、以及习题难度和区分度,利用项目反应理论的二参数模型预测学生在习题上的得分。上述方法可以给学生提供更有效、更详细以及更鲁棒的认知诊断结果。

Cognitive diagnosis method based on deep project response theory

【技术实现步骤摘要】
基于深度项目反应理论的认知诊断方法
本专利技术涉及深度学习和教育数据挖掘领域,尤其涉及一种基于深度项目反应理论的认知诊断方法。
技术介绍
当前的大数据和数据挖掘技术快速发展,尤其是在教育领域,大量的习题数据被收集,并且被广泛应用于教育相关领域。比如个性化试题推荐可以给学生推荐合适的练习题,来加强学生在知识点或者答题技巧上的熟练度;自适应测试可以根据学生自身的认知情况,给学生提供个性化的测试方案。而对学生的认知情况,也就是学上在知识点或者答题技巧上的掌握程度的准确诊断,是这些应用的基础。传统的认知诊断方法都基于统计学,仅仅使用学生答题结果的历史数据来对学生进行诊断,对数据敏感,且鲁棒性不好。围绕认知诊断这个问题,很多研究者提出了不少方法,但是这些方法都没能够使用习题文本数据来提升诊断效果,然而,教育领域已经积累了很多习题数据,尤其是文本数据。因此如何利用习题文本,来增强传统认知诊断模型的有效性以及鲁棒性,是当前教育大数据背景下亟待解决的一个重要问题。
技术实现思路
本专利技术的目的是提供一种基于深度项目反应理论的认知诊断方法,可以给学生提供更有效、更详细以及更鲁棒的认知诊断结果,从而能够更有针对性的给学生推荐合适的习题。本专利技术的目的是通过以下技术方案实现的:一种基于深度项目反应理论的认知诊断方法,其特征在于,包括:获取学生的历史习题数据;对历史习题数据进行预处理,使用深度学习方法并结合预处理结果对学生和习题数据进行建模,获得学生的潜在特质、以及习题难度和区分度;根据学生的潜在特质、以及习题难度和区分度,利用项目反应理论的二参数模型预测学生在习题上的得分。由上述本专利技术提供的技术方案可以看出,充分利用了习题数据,能够增强认知诊断的有效性和鲁棒性,同时,弥补了传统项目反映理论的单维性和不能冷启动以及大规模训练的弊端。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。图1为本专利技术实施例提供的一种基于深度项目反应理论的认知诊断方法的流程图。具体实施方式下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。本专利技术实施例提供一种基于深度项目反应理论的认知诊断方法,其具体基于深度项目反应理论实现,如图1所示,主要包括如下步骤:步骤11、获取学生的历史习题数据。本专利技术实施例中,所述历史习题数据包含了M个习题,每一习题包括的习题描述文本以及习题包含的知识点集合。同时,还获取学生的答题记录,其中的实际得分将用于训练阶段。步骤12、对历史习题数据进行预处理,使用深度学习方法并结合预处理结果对学生和习题数据进行建模,获得学生的潜在特质、以及习题难度和区分度。本步骤主要包括两个阶段:预处理阶段与建模阶段,下面给出各阶段的优选实施方式。一、预处理阶段。预处理的目的是使用通信的数学形式来表示相关数据。1)假设有L个学生和M个习题,则组成了答题记录R={Rij|1≤i≤L,1≤j≤M};其中Rij=<Si,Qj,rij>是一条答题记录,表示一个学生Si在一道习题Qj上的实际得分为rij;习题Qj=<QTj,QKj>,包含习题描述文本QTj和知识点集合QKj两个部分;所有习题共包含有P个知识点;初始化学生Si在每个知识点p上的掌握度记为αp,所有知识点掌握度组成一个P维的向量α=(α1,α2,…,αP)。2)对习题的描述文本和知识点数据进行表征。假设一道习题Qj中的习题描述文本QTj由U个单词组成,通过预训练得到Word2Vec模型将习题描述文本QTj中的每一个单词表示成向量形式,得到QTj={w1,w2,…,wU},其中包含,每一个单词u都被表示成一个d0维的向量假设一道习题Qj中的知识点集合QKj由V个知识点组成,将每一个知识点v表示成一个P维的one-hot向量(独热向量)Kv∈{0,1}P,得到QKj={K1,K2,…,KV},再使用一个d1维的密集层将每一个知识点的one-hot向量Kv转化为一个d1维的密集向量转换方式为:kv=KvWk其中,是密集层的参数;转换后的知识点向量集合记为二、建模阶段。建模主要包括三个部分:利用深度神经网络建模学生的潜在特质、利用基于注意力机制的长短期记忆网络建模习题难度、以及利用深度神经网络建模习题区分度。1)利用深度神经网络建模学生的潜在特质。深度神经网络建模学生潜在特质。学生的潜在特质θ对于学生在习题上的表现具有很强的可解释性,并且与学生在每个知识点上的掌握度有很重要的关系,在每个知识点上都具有很高的掌握度的学生,潜在特质也会比较高,因为对每个知识点的掌握度可以反映学生综合能力。深度学习方法具有很好的数据自动表征和学习的能力,因此使用一个深度神经网络DNNθ来诊断学生的潜在特质θ。本专利技术实施例中,假设一个学生Si在的知识点掌握度向量为α=(α1,α2,…,αP),其中的P为所有历史习题数据中知识点的总数;预处理后的一道习题Qj的知识点向量集合为则将知识点向量集合与相应的掌握度对应相乘,得到一个d1维的向量计算方式为:本专利技术实施例中,知识点向量集合的元素数量V小于等于知识点掌握度向量α的元素数量P,上述计算时只考虑与知识点向量具有对应关系的掌握度向量。将d1维的向量Φ输入到一个深度神经网络DNNθ中,得到学生潜在特质θ:θ=DNNθ(Φ)。区别于传统项目反映理论中的潜在特质保持不变,本专利技术实施例中得到的学生潜在特质针对不同的的习题是不同的,比传统项目反映理论中的潜在特质具有更强的解释性。2)利用深度神经网络建模习题区分度。习题区分度a可以用来分析学生在习题上的表现的分布情况,区分度的建模方法,受到多维项目反映理论中习题区分度和知识点之间关系的启发,习题区分度和习题所包含的知识点之间有很紧密的关系。因此,通过对习题的知识点进行建模来得到习题的区分度,同样,深度学习方法具有很好的数据自动表征和学习的能力,使用一个和DNNθ结构一样的深度神经网络DNNa来建模习题区分度a,深度神经网络DNNa和DNNθ结构一样,但是他们之间的参数并不共享。本专利技术实施例中,预处理后的一道习题Qj的知识点向量集合为将所有知识点向量累加,得到一个d1维的向量计算方式为:将得到的d1维的向量A输入到一个深度神经网络DNNa中来确定习题Qj的区分度;由于在传统的项目反映理论中,习题区分度的理论范围区间为[-4,4],因此,对深度神经网络DNNa的输出值DNNa(A)进行变换:先通过一个sigmoid函数归一化到区间[0,1];然后通过平移和放缩变换,将sigmoid函数输出值减去0.5,再乘以8,从而将DNNa的输出值变换到习题区分度的理论范围区间[-4,4]中,得到习题Qj的区分度a,变换方式表示为:a=8×(sigmoid(DNNa(A))-0.5)。3)利用基于注意力机制的长短期记忆网络建模习题难度。习题难度本文档来自技高网...

【技术保护点】
1.一种基于深度项目反应理论的认知诊断方法,其特征在于,包括:获取学生的历史习题数据;对历史习题数据进行预处理,使用深度学习方法并结合预处理结果对学生和习题数据进行建模,获得学生的潜在特质、以及习题难度和区分度;根据学生的潜在特质、以及习题难度和区分度,利用项目反应理论的二参数模型预测学生在习题上的得分。

【技术特征摘要】
1.一种基于深度项目反应理论的认知诊断方法,其特征在于,包括:获取学生的历史习题数据;对历史习题数据进行预处理,使用深度学习方法并结合预处理结果对学生和习题数据进行建模,获得学生的潜在特质、以及习题难度和区分度;根据学生的潜在特质、以及习题难度和区分度,利用项目反应理论的二参数模型预测学生在习题上的得分。2.根据权利要求1所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,所述历史习题数据包含了M个习题,每一习题包括的习题描述文本以及习题包含的知识点集合。3.根据权利要求1或2所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,假设有L个学生和M个习题,则组成了答题记录R={Rij|1≤i≤L,1≤j≤M};其中Rij=<Si,Qj,rij>是一条答题记录,表示一个学生Si在一道习题Qj上的实际得分为rij;习题Qj=<QTj,QKj>,包含习题描述文本QTj和知识点集合QKj两个部分;所有习题共包含有P个知识点;初始化学生Si在每个知识点p上的掌握度记为αp,所有知识点掌握度组成一个P维的向量α=(α1,α2,…,αP)。4.根据权利要求1所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,所述对历史习题数据进行预处理包括:假设一道习题Qj中的习题描述文本QTj由U个单词组成,通过预训练得到Word2Vec模型将习题描述文本QTj中的每一个单词表示成向量形式,得到QTj={w1,w2,…,wU},其中包含,每一个单词u都被表示成一个d0维的向量假设一道习题Qj中的知识点集合QKj由V个知识点组成,将每一个知识点v表示成一个P维的one-hot向量Kv∈{0,1}P,得到QKj={K1,K2,…,KV},再使用一个d1维的密集层将每一个知识点的one-hot向量Kv转化为一个d1维的密集向量转换方式为:kv=KvWk其中,是密集层的参数;转换后的知识点向量集合记为5.根据权利要求1或4所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,所述使用深度学习方法并结合预处理结果对学生和习题数据进行建模,获得学生的潜在特质、以及习题难度和区分度,包括三个部分:利用深度神经网络建模学生的潜在特质、利用基于注意力机制的长短期记忆网络建模习题难度、以及利用深度神经网络建模习题区分度。6.根据权利要求5所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,所述利用深度神经网络建模学生的潜在特质包括:假设一个学生Si在的知识点掌握度向量为α=(α1,α2,…,αP),其中的P为所有历史习题数据中知识点的总数;预处理后的一道习题Qj的知识点向量集合为则将知识点向量集合与相应的掌握度对应相乘,得到一个d1维的向量计算方式为:将d1维的向量Φ输入到一个深度神经网络DNNθ中,得到学生潜在特质θ:θ=DNNθ(Φ)。7.根据权利要求5所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,利用深度神经网络建模习题区...

【专利技术属性】
技术研发人员:刘淇陈恩红程松黄仔黄振亚陈玉莹马海平
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1