当前位置: 首页 > 专利查询>扬州大学专利>正文

一种错题收集及重难点知识提取方法技术

技术编号:26222798 阅读:53 留言:0更新日期:2020-11-04 10:53
本发明专利技术公开了教育技术领域内的一种错题收集及重难点知识提取方法,包括以下步骤:(1)错题收集模块将收集到的错题的题干发送到题干知识点数据库中储存,并将收集到的错误的题干连同答案一起发送到错题数据库中储存;(2)创建候选知识点数据库;(3)题干知识点数据库与候选知识点数据库进行知识点匹配,得到题干知识点;(4)接收来自题干知识点数据库的信息与题干知识点进行比较,计算频率,得出难点知识;接收来自题库的信息,进行知识点匹配,计算频率,得到重点知识,将难点知识和重点知识分类放入重难点数据库;(5)错题数据库、题干知识点数据库和重难点数据库导出成文档;使用本发明专利技术可根据收集到的错题提取出重难点知识。

【技术实现步骤摘要】
一种错题收集及重难点知识提取方法
本专利技术属于教育
,特别涉及一种错题收集及重难点知识提取方法。
技术介绍
随着教育电子化的持续发展,各类数据持续增长,分析、利用这些数据能够提高教学水平。然而目前对于这些数据的分析利用方法很少,仅存在一些比较基础的应用,如错题本、拍照搜题等,无法从错题中提取出重点和难点的知识。
技术实现思路
本专利技术的目的在于,克服现有技术中的不足之处,提供一种错题收集及重难点知识提取方法,解决了现有技术中无法提取重难点知识的技术难题,使用本专利技术可以实现错题的收集,并根据收集到的错题提取出重难点知识。本专利技术的目的是这样实现的:一种错题收集及重难点知识提取方法,包括以下步骤:(1)错题收集模块收集错误的题干和错题对应的答案,错题收集模块将收集到的错题的题干发送到题干知识点数据库中储存,并将收集到的错误的题干连同答案一起发送到错题数据库中储存;(2)创建候选知识点数据库;(3)题干知识点数据库与候选知识点数据库进行知识点匹配,得到题干知识点;(4)接收来自题干知识点数据库的信息与题干知识点进行比较,计算频率,得出难点知识;接收来自题库的信息,进行知识点匹配,计算频率,得到重点知识,将难点知识和重点知识分类放入重难点数据库;(5)错题数据库、题干知识点数据库和重难点数据库导出成文档。其中,候选知识点数据库中储存有各种重难知识点,题库包括线上自带的所有题目和新题目。为了提取重难点,所述步骤(3)中,知识点匹配的过程为,(301)将题干分词,并过滤掉题干中无用的词汇;(302)计算剩下的每个词语在题干知识点数据库中的词频TF1(kp,di),(303)计算剩下的每个词语在候选知识点数据库中的词频TF1(kp,dj);(304)进行相似度计算,相似度最高的为题干知识点。为了进一步提取出重难点,步骤(302)中,步骤(303)中,在步骤(303)和步骤(304)之间,还包括以下步骤:(303a)计算TF-IDF1(kp,di)=TF(kp,di)*IDF(kp1),i=1,2,…m;TF-IDF2(kp,dj)=TF(kp,dj)*IDF(kp2),j=1,2,…n;将题干知识点数据库中的每个词根据计算出的TF-IDF1(kp,di)的大小降序排列,将候选知识点数据库中的每个词根据计算出的TF-IDF2(kp,dj)的大小降序排列;其中,m表示题干知识点数据库的题干总数,n表示候选知识点数据库的题干总数,kp表示某个词语,di表示第i个题干,表示kp在题干知识点数据库中出现的最大次数;表示kp在候选知识点数据库中出现的最大次数;步骤(304)中,相似度计算具体过程为,题干知识点数据库和候选知识点数据库的知识点按照步骤(303a)排序后构成的向量空间为V={C1,C2,…,Ch},h为题干知识点数据库和候选知识点数据库合并后不同的知识点的数量,其中,Cg1表示知识点,g1=1,2,…h,题干知识点数据库中各个词语的词频构成的向量V1={X1,X2,…,Xh},Xg2表示知识点Cg2在题干知识点数据库中的词频,g2=1,2,…h,候选知识点数据库中各个词语的词频构成的向量V2={Y1,Y2,…,Yh},Yg3表示知识点Cg3在候选数据库中的词频,g3=1,2,…h,题干和候选知识点数据库构成的知识点向量相似度计算公式为:cosθg为知识点Cg对应的余弦值,余弦值越接近1,两个向量越相似,即两个知识点最相似,最相似的知识点为题干知识点,将题干知识点传入重难点知识处理模块。作为本专利技术的进一步改进,所述错题收集模块包括线上错题收集单元和书面错题收集单元,线上错题收集单元收集错题时,从题库中自动提取错误的题干;书面错题收集单元将图片转换成计算机可以编辑的图像放入图像缓冲区,在题干与答案开始的第一行分别标上不同的标识符,图像缓冲区先自动识别标识符,将题干与答案区分开并生成信息发向对应的数据库。为了进一步方便识别,所述步骤(5)中,错题数据库导出错题,题干、错误答案和正确答案分别以不同的颜色显示,重难点数据库导出的知识点中,重点和难点分别以不同的颜色显示。附图说明图1为本专利技术的流程框图。图2位本专利技术中知识点匹配的流程框图。具体实施方式下面结合附图对本专利技术进行进一步说明。如图1和图2所示的一种错题收集及重难点知识提取方法,包括以下步骤:(1)错题收集模块收集错误的题干和错题对应的答案,错题收集模块将收集到的错题的题干发送到题干知识点数据库中储存,并将收集到的错误的题干连同答案一起发送到错题数据库中储存;(2)创建候选知识点数据库;(3)题干知识点数据库与候选知识点数据库进行知识点匹配,得到题干知识点;(4)接收来自题干知识点数据库的信息与题干知识点进行比较,计算频率,得出难点知识;接收来自题库的信息,进行知识点匹配,计算频率,得到重点知识,将难点知识和重点知识分类放入重难点数据库;(5)错题数据库、题干知识点数据库和重难点数据库导出成文档。其中,候选知识点数据库中储存有各种重难知识点,题库包括线上自带的所有题目和新题目,每扫描一个书面的题目就自动与线上自带的题目做比较,若线上自带的题目中没有,则将该书面的题目作为新题目;步骤(4)中,重难点知识处理模块内置一个计数器,当有知识点传来时,对于不同的知识点分别计数,最终知识点出现的次数p≥p设时,进行下一步,否则丢弃;若该知识点来自题干数据库,则传入重难点数据库的难点一类;若该知识点来自题库,则传入重难点数据库的重点一类;p设为设定的知识点出现次数的阈值,p设为大于2的自然数;步骤(5)中,错题数据库导出错题,题干、错误答案和正确答案分别以不同的颜色显示,重难点数据库导出的知识点中,重点和难点分别以不同的颜色显示。为了提取重难点,所述步骤(3)中,知识点匹配的过程为,(301)将题干分词,并过滤掉题干中无用的词汇;(302)计算剩下的每个词语在题干知识点数据库中的词频TF1(kp,di),(303)计算剩下的每个词语在候选知识点数据库中的词频TF1(kp,dj);(304)进行相似度计算,相似度最高的为题干知识点。为了进一步提取出重难点,步骤(302)中,步骤(303)中,在步骤(303)和步骤(304)之间,还包括以下步骤:(303a)计算TF-IDF1(kp,di)=TF(kp,di)*IDF(kp1),i=1,2,…m;TF-IDF2(kp,dj)=TF(kp,dj)*IDF(kp2),j=1,2,…n;将题干知识点数据库中的每个词根据计算出的TF-IDF1(kp,di)的大小降序排列,将候选知识点数据库中的每个词根据计算出的TF-IDF2(kp,dj)的大小降序排本文档来自技高网...

【技术保护点】
1.一种错题收集及重难点知识提取方法,其特征在于,包括以下步骤:/n(1)错题收集模块收集错误的题干和错题对应的答案,错题收集模块将收集到的错题的题干发送到题干知识点数据库中储存,并将收集到的错误的题干连同答案一起发送到错题数据库中储存;/n(2)创建候选知识点数据库;/n(3)题干知识点数据库与候选知识点数据库进行知识点匹配,得到题干知识点;/n(4)接收来自题干知识点数据库的信息与题干知识点进行比较,计算频率,得出难点知识;接收来自题库的信息,进行知识点匹配,计算频率,得到重点知识,将难点知识和重点知识分类放入重难点数据库;/n(5)错题数据库、题干知识点数据库和重难点数据库导出成文档。/n其中,候选知识点数据库中储存有各种重难知识点,题库包括线上自带的所有题目和新题目。/n

【技术特征摘要】
1.一种错题收集及重难点知识提取方法,其特征在于,包括以下步骤:
(1)错题收集模块收集错误的题干和错题对应的答案,错题收集模块将收集到的错题的题干发送到题干知识点数据库中储存,并将收集到的错误的题干连同答案一起发送到错题数据库中储存;
(2)创建候选知识点数据库;
(3)题干知识点数据库与候选知识点数据库进行知识点匹配,得到题干知识点;
(4)接收来自题干知识点数据库的信息与题干知识点进行比较,计算频率,得出难点知识;接收来自题库的信息,进行知识点匹配,计算频率,得到重点知识,将难点知识和重点知识分类放入重难点数据库;
(5)错题数据库、题干知识点数据库和重难点数据库导出成文档。
其中,候选知识点数据库中储存有各种重难知识点,题库包括线上自带的所有题目和新题目。


2.根据权利要求1所述的一种错题收集及重难点知识提取方法,其特征在于,所述步骤(3)中,知识点匹配的过程为,
(301)将题干分词,并过滤掉题干中无用的词汇;
(302)计算剩下的每个词语在题干知识点数据库中的词频TF1(kp,di),(303)计算剩下的每个词语在候选知识点数据库中的词频TF1(kp,dj);
(304)进行相似度计算,相似度最高的为题干知识点。


3.根据权利要求2所述的一种错题收集及重难点知识提取方法,其特征在于,步骤(302)中,
步骤(303)中,
在步骤(303)和步骤(304)之间,还包括以下步骤:
(303a)计算TF-IDF1(kp,di)=TF(kp,di)*IDF(kp1),i=1,2,…m;
TF-IDF2(kp,dj)=TF(kp,dj)*IDF(kp2),j=1,2,…n;
将题干知识点数据库中的每个词根据计算出的TF-IDF1(kp,di)的大小降序排列,将候选知识点数据库中的每个词根据计算出的TF-IDF2(kp,dj)的大小...

【专利技术属性】
技术研发人员:吴鑫盈赵耀孙悦
申请(专利权)人:扬州大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1