一种多步分层的学习者认知水平挖掘方法及系统技术方案

技术编号:22688960 阅读:56 留言:0更新日期:2019-11-30 03:35
本发明专利技术属于教育数据挖掘技术领域,公开了一种多步分层的学习者认知水平挖掘方法及系统,结合布鲁姆认知领域目标分类及认知心理,构建试题‑知识认知水平矩阵P,综合学习者知识认知水平矩阵和试题‑知识认知水平矩阵构建学习者理想答题矩阵,利用极大似然估计挖掘学习者知识掌握候选集合;对候选集合内元素的全局期望进行综合判断,获取学习者最终的知识认知水平,并将结果使用雷达图可视化输出。本发明专利技术通过挖掘出学习者的知识认知水平后,利用雷达图反馈给学习者的挖掘结果将更加直观、通俗易懂,辅助学习者及时调整学习方案;模型挖掘出的试题隐参数可以评估组成此次测试的试题质量,提高了测试准确性与可信度。

A multi-step hierarchical mining method and system for learners' cognitive level

The invention belongs to the technical field of education data mining, and discloses a multi-step layered method and system for mining the cognitive level of learners. Combining with the goal classification and cognitive psychology in the cognitive field of bloom, the test question \u2011 knowledge cognitive level matrix P is constructed, and the ideal answer matrix of learners is constructed by synthesizing the knowledge cognitive level matrix and the knowledge cognitive level matrix of the test question \u2011 knowledge However, we estimate and mine the candidate set of learners' knowledge mastery, make a comprehensive judgment on the global expectation of the elements in the candidate set, obtain the final knowledge cognitive level of learners, and use the radar chart to visualize the results. After the knowledge cognitive level of learners is mined out, the mining results fed back to learners by radar chart will be more intuitive, easy to understand, and help learners adjust the learning scheme in time; the hidden parameters of the test questions mined by the model can evaluate the quality of the test questions forming the test, and improve the accuracy and reliability of the test.

【技术实现步骤摘要】
一种多步分层的学习者认知水平挖掘方法及系统
本专利技术属于教育数据挖掘
,尤其涉及一种多步分层的学习者认知水平挖掘方法及系统。
技术介绍
目前,最接近的现有技术:迄今为止,整个测验统计理论的发展可以分为标准测验理论阶段和新一代测验理论阶段。以经典测量理论和项目反应理论为代表的标准测验理论聚焦于测验分数的结果,无法对学习者得分背后所隐藏的心理内部加工过程、加工技能和认知结构等进行分析判断,漠视了具有相同测验分数的学习者常常具有不同的认知结构和认知策略。以认知诊断为核心的新一代测量理论充分采取认知心理学有关人类知识加工过程内在机制,通过对学习者内部心理加工过程的测量,提供具有针对性的认知挖掘信息,并强调对学习者的认知优势与劣势进行分析,由此开发出具有认知诊断的心理计量模型--认知诊断模型。认知诊断模型对学习者进行单独建模,模式化其认知结构,定量的分析学习者之间的个体差异与认知结构,从而帮助教师及时掌握学习者学习状态,及早进行学习干预,实现因材施教;帮助学习者通过个性化学习信息反馈,提供针对性的补救措施及建议,实现自主学习;更可以帮助教育管理者合理均衡地分配教育资源,实现教育公平。目前学习者认知水平挖掘的方式主要是以项目反应理论(ItemResponseTheory,IRT)与确定性输入,噪声“与”门(theDeterministicInput,Noisy“And”Gatemodel,DINA)模型为主。其中,IRT将学习者在试题上的作答情况建模为一维连续的能力值,并且学习者的综合能力以此能力值作为判定,通过项目特征曲线(ItemCharacteristicCurve,ICC)表示学习者在不同的潜在特质下与试题作答概率以及试题参数的关系。而DINA模型是一个多维离散认知诊断模型,由于客观试题的作答结果具有非对即错的特点,DINA模型结合学习者在客观试题上的作答情况,通过教育专家对试题所考查知识点进行标记,使用EM算法最大化总似然函数的边际似然,得到试题的隐参数估计,其中试题隐参数主要是指失误参数与猜测参数,然后通过最大化学习者试题得分后验概率来计算学习者的二分知识点掌握向量。在获得了学习者相应的知识点掌握情况后,对学习者进行个性化的学习资源推荐,从而实现自适应个性化学习。但是,在IRT模型下,学习者被建模成一个具有单一能力值的对象,除试题参数(难度、鉴别度、猜测率)之外,只存在这单一的综合能力因素影响学习者在试题上的作答情况,然而在实际的测试中,不同的试题考查的知识点并非单一的,且即使考查知识点相同但其要求解题的知识点层次也不相同,单一的学习者能力难以准确描述学习者在不同维度即不同知识点上的能力差别。而传统的DINA模型只能对学习者的知识掌握进行离散化估计,即只能判断学习者对某一知识点掌握或未掌握,不能挖掘其具体的知识点掌握程度,且由DINA模型得到的学习者知识掌握结果可解释性不强,难以准确描述挖掘结果具有的实际意义。综上所述,现有技术存在的问题是:(1)现有技术中,项目反应理论依赖众多假设,不能在多维上建模学习者的知识掌握,没有对学习者的潜在特质作出精细化分析,只能在大容量样本(学习者的能力分布范围广,测试用题数量多)下以项目特征函数描述出作答反应结果与学习者潜在特质及试题参数的关系或趋势,而不能作出具体分析,挖掘的粒度较粗;(2)现有技术中,DINA模型在挖掘过程中,不考虑属性间的层级关系,只能挖掘出学习者的二维离散型知识掌握(掌握或未掌握),使得挖掘粒度较粗;且在其划分学习者知识掌握属性的标准时,一般是由其作答反应的后验概率值决定的,误差较大,导致其没有对学习者的知识掌握程度、知识的结构层次、知识的认知水平进行深入诊断挖掘;(3)现有技术大多基于统计分析或机器学习方法,通常将诊断模型视为黑盒子,对于学习诊断的过程及结果并不能提供支撑性的可解释信息,导致最终挖掘结果的解释性不强,因而无法对“学习病情”进行有效地循证归因,导致了教师、学习者对诊断结果的不信任、不接受,无法使得学习者对自身的知识掌握水平有充分认识,从而有效地、有针对性地对学习方案进行规划调整,造成学习效率低,学习成本高等问题。综上,挖掘粒度较粗、挖掘不深入、可解释性不强等问题导致目前的方法对学习者认知水平挖掘并未真正发挥其提升学习效果的关键性作用。解决上述技术问题的难度:(1)如何将布鲁姆认知领域目标分类与试题-知识认知水平矩阵相结合,从而产生多步分层学习者认知水平挖掘模型的输入数据;(2)如何将二元的学习者知识掌握程度映射为结合布鲁姆认知领域目标分类的多层级掌握模式,即试题隐参数的重新定义问题如何解决;(3)如何在挖掘得到的学习者在知识认知水平候选集合中,寻找最接近于学习者实际知识掌握情况的知识掌握模式,并以何种形式将挖掘结果反馈给学习者。解决上述技术问题的意义:本专利技术是多步分层的学习者认知水平挖掘方法,结合布鲁姆认知领域分类目标与认知心理,通过输入学习者试题作答情况与试题-知识认知水平矩阵,构建多步分层学习者认知水平挖掘模型,重新定义学习者潜在答题矩阵与试题隐参数,挖掘学习者在不同知识点上的认知水平,从多维角度进行分析,对挖掘结果提供多方位的可解释性分析,从而对学习者的知识掌握程度、知识的结构层次、知识的认知水平进行深入诊断挖掘。本专利技术在对学习者学习特质赋值时提供了更加深入细致的挖掘性信息,根据学习者的不同作答模式,提供出现该种作答模式的潜在的、内隐的认知结构分析,使得挖掘粒度更加精细化。本专利技术在挖掘结果的决策上使用全局期望,将挖掘结果映射到布鲁姆认知领域分类目标中并使用雷达图可视化输出,既对挖掘结果提供了可靠的支撑性信息,降低挖掘误差,同时完整、清晰且直观的反映学习者认知状态,对“学习病情”进行有效地循证归因,有利于对学习者当前发展状况进行反馈并提供补救建议及措施从而有针对性的促进个体认知发展,提升学习者学习效果。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种多步分层的学习者认知水平挖掘方法及系统。本专利技术目的在于解决现有技术中,IRT模型将学习者建模成一个具有单一能力值的对象,难以准确描述学习者在不同维度即不同知识点上的能力差别;传统的DINA模型只能对学习者的知识掌握进行离散化估计,而不能挖掘其具体的知识点掌握程度,难以准确描述挖掘结果具有的实际意义,其挖掘结果的可解释性不强,挖掘结果的粒度较粗。本专利技术是这样实现的,一种多步分层的学习者认知水平挖掘方法,包括以下步骤:步骤一:结合布鲁姆认知领域目标分类及认知心理,构建试题-知识认知水平矩阵P,引入教育专家对试题考查的知识点水平进行标记。步骤二:利用已知的学习者知识认知水平矩阵和试题-知识认知水平矩阵重新定义学习者理想答题矩阵,利用多步分层学习者认知水平挖掘模型的边际极大似然估计和EM算法挖掘学习者在某次测试中各道试题上的失误率与猜测率,通过已估计出的试题参数,使用极大似然估计计算学习者在各知识点上的掌握模式,组建学习者知识掌握候选集合。...

【技术保护点】
1.一种多步分层的学习者认知水平挖掘方法,其特征在于,所述多步分层的学习者认知水平挖掘方法包括以下步骤:/n步骤一,结合布鲁姆认知领域目标分类及认知心理,构建试题-知识认知水平矩阵P,引入教育专家对此次试题考查的知识点认知水平进行标记;/n步骤二,利用已知的学习者知识认知水平矩阵和试题-知识认知水平矩阵重新定义学习者理想答题矩阵,利用分步多层学习者认知水平挖掘模型的边际极大似然估计和期望最大化算法挖掘学习者在某次测试中各道试题上的失误率与猜测率,通过已估计出的试题参数,使用极大似然估计计算学习者在各知识点上的掌握模式,组建学习者知识掌握候选集合;/n步骤三,对集合内元素的全局期望进行判断,获取学习者最终的知识认知水平,并将结果使用雷达图可视化输出。/n

【技术特征摘要】
1.一种多步分层的学习者认知水平挖掘方法,其特征在于,所述多步分层的学习者认知水平挖掘方法包括以下步骤:
步骤一,结合布鲁姆认知领域目标分类及认知心理,构建试题-知识认知水平矩阵P,引入教育专家对此次试题考查的知识点认知水平进行标记;
步骤二,利用已知的学习者知识认知水平矩阵和试题-知识认知水平矩阵重新定义学习者理想答题矩阵,利用分步多层学习者认知水平挖掘模型的边际极大似然估计和期望最大化算法挖掘学习者在某次测试中各道试题上的失误率与猜测率,通过已估计出的试题参数,使用极大似然估计计算学习者在各知识点上的掌握模式,组建学习者知识掌握候选集合;
步骤三,对集合内元素的全局期望进行判断,获取学习者最终的知识认知水平,并将结果使用雷达图可视化输出。


2.如权利要求1所述的多步分层的学习者认知水平挖掘方法,其特征在于,步骤一具体包括:
步骤a):预处理收集到的数据集,对学习者答题数据进行处理,去除无效数据即全部学习者作答正确或作答错误的试题;
步骤b):根据布鲁姆认知领域目标分类,由教育专家对试题所考查的知识点水平进行标记,得到试题-知识认知水平矩阵P;
步骤c):试题-知识认知水平矩阵中的每一行表示某道试题考查哪些知识点并考查到哪种水平,每一列表示某个知识点被那些试题考查,Pvk=0表示试题v没有考查知识点k,Pvk=c(1≤c≤6)表示试题v考查知识点k并考查到c水平。


3.如权利要求1所述的多步分层的学习者认知水平挖掘方法,其特征在于,步骤二具体包括:
步骤1):将试题-知识认知水平矩阵P转换成试题知识点考查矩阵Q,由水平矩阵转换成二元矩阵,则qvk=0表示试题v未考查知识点k,qvk=1表示试题v考查了知识点k,转换过程使用指示函数I(·),即



步骤2):计算学习者潜在答题情况或称理想答题情况,每个学习者u描述为一个知识点掌握程度向量αu={αu1,αu2...αuk},其中每一维对应一个知识点;在已知学习者u的知识点掌握向量αu的情况下,对于学习者u未作答的试题v,根据下式获得学习者对试题的潜在作答情况:



即当学习者u掌握了正确回答试题v所需的全部知识点时,ηuv=1;
步骤3):计算题目参数失误率s和猜测率g,定义为:
学习者u掌握了回答试题v所需的全部知识点,但是由于某些原因回答错误;即失误参数:
sj=P(Ruv=0|ηuv=1);
学习者u没有掌握回答试题v所需的全部知识点,甚至一个知识点都没掌握,但是回答正确;即猜测参数:
gj=P(Ruv=1|ηuv=0);
步骤4):实际响应矩阵R(Ruv)的概率模型为:



由此得到二元知识掌握挖掘模型的总似然函数:



其中,L=2K,由于上式中含有隐变量αl,无法直接进行极大似然估计,引入EM算法,采用边缘极大似然估计的方法求解试题参数;
步骤5):在已知项目参数条件下,利用极大似然估计求解学习者知识掌握情况,得到学习者的二分知识点掌握向量;



步骤6):学习者知识点挖掘结果为0表示该学习者未掌握该知识点,挖掘结果为1表示该学习者已掌握该知识点;针对挖掘结果为1的学习者和知识点,利用多步分层的学习者认知水平挖掘方法进行进一步知识水平挖掘;
步骤7):根据新标记的试题-知识点层次矩阵P,计算学习者的潜在作答情况,将学习者u在试题v上的潜在作答结果重新定义为:



其中,I(·)为指示函数,即满足括号内条件函数值为1,不满足则为0;
步骤8):初始化学习者知识掌握层次,给定部分已知其知识认知水平的学习者;
步骤9):重新定义失误参数,已知试题-知识点水平要求pv=[pv1,pv2,pv3],表示第v题对学习者知识点掌握层次的要求;若学习者对应的每个知识点实际认知水平都大于试题所考查的知识点要求水平,则该学习者在理论上应该答对该道试题;若实际学习者在该试题上均作答错误,则判断学习者在此试题上作答出现失误;
步骤10):重新定义猜测参数,已知试题-知识点水平要求pv=[pv1,pv2,pv3],表示第v题对学习者知识点掌握层次的要求;若学习者对应的每个知识点实际认知水平至少存在一个小于试题所考查的知识点要求水平,则该学习者在理论上应该答错该道试题;若实际学习者在该试题上均作答正确,则判断学习者在此试题上作答进行了猜测;
步骤11):如果某个知识点水平相等,认为满足试题作答正确的要求,则若每个知识点水平完全相等认为可以在理论上答对;学习者的实际知识水平掌握存在至少一个小于对应的试题要求知识点水平,则认为学习者在作答该题中理论上会作答错误;
步骤12):在所有7K(0级至6级,共K个知识点)种可能的学习者知识水平掌握层次模式下,计算学习者的潜在答题矩阵π,对比待估计学习者的真实作答情况,得到该学习者在每道试题上的作答反应,失误率s、未失误率1-s、猜测率g、未猜测率1-g,并计算学习者的试题作答概率:



步骤13):选取使得试题作答概率最大值时的学习者知识认知水平模式,如存在相同的最大试题作答概率,将该学习者知识认知水平模式纳入候选集合中,构成学习者知识认知水平模式候选集合。


4.如权利要求3所述的多步分层的学习者认知水平挖掘方法,其特征在于,步骤EM算法包括:
E步,利用得到的sv与gv计算矩阵P(R|α)=[P(Ru|αl)]U×L的值,并利用P(R|α)计算矩阵P(α|R)=[P(αl|Ru)]L×U的值;
M步,分别令和可得:其中表示属于第l种知识点掌握模式的学习者中缺乏至少一个第v题所需知识点的人数期望,表示中回答正确第v题的人数期望,和的含义与和相似,不同之处在于与是在学习者掌握所有第v题所需知识点的情形下的期望;由E步中得到的估计,计算和的值,并由此得到新的sv与gv估计。


5.如权利要求1所述的多步分层的学习者认知水平挖掘方法,其特征在于,步骤二进一步包括:
步骤(1):采用的数据集包括:某高中300名学习者在20道数学试题上的作答结果以及此20道试题所考查的5种知识点,每道试题考查的知识点不同且水平不同;
某大学103名学习者在15道C语言试题上的作答结果以及此15道试题所考查的10种知识点,每道试题考查的知识点不同且水平不同;
步骤(2):将试题-知识点层次矩阵导入,转化为二元Q矩阵,以进行二元知识掌握模型计...

【专利技术属性】
技术研发人员:王志锋刘继斌刘清堂童名文魏艳涛邓伟姚璜叶俊民赵刚
申请(专利权)人:华中师范大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1