一种试题自动分类系统及方法技术方案

技术编号:20546103 阅读:25 留言:0更新日期:2019-03-09 19:01
本发明专利技术涉及网络教育技术领域,具体涉及一种试题自动分类系统,包括待分类试题数据库、自动分类模块、标签库、待审核试题数据库、人工审核模块、人工分类模块、自动分类纠正模块、已分类试题数据库以及同类题目查找模块本发明专利技术在自动分类试题时候,将高正确率的标签特征词集合取代低正确率的标签特征词集合,将不断提高分类的正确性;提取出试题中的试题特征词以及标签中的标签特征词,利用K近邻算法找出对应标签,极大的提高了对试题分类的速度;建立一个完善的人工审核机制,保证了对题库分类的准确性。

An Automatic Classification System and Method for Examination Questions

The invention relates to the field of network education technology, in particular to an automatic classification system of test questions, including a database of test questions to be classified, an automatic classification module, a label library, a database of test questions to be audited, a manual examination module, a manual classification module, an automatic classification correction module, a database of classified test questions and a search module for similar topics. The invention will be high in automatic classification of test questions. The correct label feature word set replaces the low correct label feature word set, which will continuously improve the classification accuracy; extract the test question feature words and label feature words in the test questions, and use K-nearest neighbor algorithm to find the corresponding label, which greatly improves the speed of the classification of the test questions; establish a perfect manual auditing mechanism to ensure the accuracy of the classification of the question bank. \u3002

【技术实现步骤摘要】
一种试题自动分类系统及方法
本专利技术涉及网络教育
,具体涉及一种试题自动分类系统及方法。
技术介绍
计算机技术和网络技术的不断发展,使得一些无纸化且随机选题的练习和考试方式越来越多地应用于各种考试系统中,这种应用的实现离不开电子试题库。通常在电子试题库中,试题以手工方式录入,且一次录入就可长期使用,然而随着试题不断地大量地补充,试题库管理的一个十分突出的问题:试题分类,传统的人工分类和检测已经无法胜任这项艰巨的工作了。因此,如何有效地分类是试题库管理中亟待解决的问题。试题库管理有着十分重要的意义和价值,良好的试题库管理系统可以为考试系统提供有效的、丰富的试题数据,还可以为师生的教、学活动提供一种新的教学平台。然而,网络带来的信息资源的共享以及信息数据量的爆炸性增长使得传统的手工信息处理方法变得不切实际,因此需要采用自动化程度更高、效率更好的信息处理方法,帮助人们更高效地进行试题分类处理。在目前,管理试题库都是靠人工进行分类,或者在试题入库前已经知道类别,将对应类别的试题导入数据库。目前也有利用机器学习和深度学习的方法来实现文本分类,但是准确率都遇到了瓶颈。
技术实现思路
本专利技术的目的是针对现有技术中的上述不足,提供了一种试题自动分类系统及方法。本专利技术的目的通过以下技术方案实现:一种试题自动分类系统,包括待分类试题数据库、自动分类模块、标签库、待审核试题数据库、人工审核模块、人工分类模块、自动分类纠正模块、已分类试题数据库以及同类题目查找模块;所述自动分类模块,用于将待分类试题数据库中的试题与标签库的标签进行匹配,并将匹配后的试题传送至待审核试题数据库;所述人工审核模块,用于审核试题自动分类的正确性,若自动分类正确将试题传送至已分类试题数据库,若自动分类错误则将试题传送至人工分类模块;所述人工分类模块,用于将自动分类错误的试题与标签库的标签进行匹配,若标签库存在与试题匹配的标签,直接将试题与该标签进行匹配,若标签库不存在与试题匹配的标签,则创造新的标签与试题匹配,并将新的标签加入至标签库中,匹配后的试题传送至分类试题数据库;所述自动分类纠正模块用于提高自动分类模块的正确性;所述同类题目查找模块用于将分类试题数据库的试题进一步进行分类。一种分类方法,包括以下步骤:步骤A:自动分类模块将待分类试题数据库中的试题与标签库的标签进行匹配,并将匹配后的试题传送至待审核试题数据库;步骤B:人工审核模块对待审核试题数据库的自动分类试题进行审核,若自动分类正确将试题传送至已分类试题数据库,若自动分类错误则将试题传送至人工分类模块;步骤C:人工分类模块将自动分类错误的试题与标签库的标签进行匹配,若标签库存在与试题匹配的标签,直接将试题与该标签进行匹配,若标签库不存在与试题匹配的标签,则创造新的标签与试题匹配,并将新的标签加入至标签库中,匹配后的试题传送至分类试题数据库;步骤D:自动分类纠正模块根据自动分类的准确性以及人工分类的准确性从而反馈至自动分类模块中提高自动分类模块的准确性;。步骤E:同类题目查找模块将分类试题数据库的试题进一步进行分类。本专利技术进一设置为,所述步骤A包括以下步骤:A1:从待分类试题数据库的待分类试题中提取试题特征词;A2:将试题特征词储存至试题特征词集合中;A3:从标签库的已有标签中提取标签特征词;A4:将标签特征词储存至标签特征词集合中;A5:将试题特征词集合与标签特征词集合经过K近邻算法模型;A6:给待分类试题匹配最相近的标签。本专利技术进一设置为,所述步骤A1中的提取试题特征词包括以下步骤:a1:将待分类试题数据库的待分类试题进行预处理;a2:从预处理后的试题中提出其中一条试题;a3:对该试题进行分词;a4:通过分词后得到若干个候选词;a5:计算各个候选词的权重;a6:得到待分类试题的试题特征词。本专利技术进一设置为,所述步骤D包括以下步骤:B1:经过人工分类模块得到新的标签库,在新的标签库中人工提取新的标签特征词集合;B1:统计试题特征词集合与自动提取的标签特征词集合正确匹配的次数x;B2:统计试题特征词集合与人工提取的标签特征词集合正确匹配的次数y;B3:若y大于x,则在下一次自动分类模块自动分类时,将人工提取的标签特征词集合取代自动提取的标签特征词集合;若y小于x,则在下一次自动分类模块自动分类时,继续使用上一次的自动提取的标签特征词集合。本专利技术进一设置为,所述步骤E包括以下步骤:C1:提取每个试题的试题特征词集合;C2:排序出试题特征词集合的相似度;C3:查找出同类题目。本专利技术进一步设置为,一个试题可匹配多个标签。本专利技术进一步设置为,所述候选词包括名词、公式、符号以及图形。本专利技术的有益效果:1.本专利技术在自动分类试题时候,将高正确率的标签特征词集合取代低正确率的标签特征词集合,将不断提高分类的正确性;2.提取出试题中的试题特征词以及标签中的标签特征词,利用K近邻算法找出对应标签,极大的提高了对试题分类的速度;3.建立一个完善的人工审核机制,保证了对题库分类的准确性。附图说明利用附图对专利技术作进一步说明,但附图中的实施例不构成对本专利技术的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。图1是本专利技术的系统流程图;图2是本专利技术的自动分类模块的流程图;图3是本专利技术的试题特征词提取的流程图;图4是本专利技术的人工审核模块的流程图;图5是本专利技术的人工分类模块的流程图;图6是本专利技术的自动分类纠正模块的流程图;图7是本专利技术的同类题目查找模块的流程图。具体实施方式结合以下实施例对本专利技术作进一步描述。由图1至图7可知;本实施例所述的一种试题自动分类系统,包括待分类试题数据库、自动分类模块、标签库、待审核试题数据库、人工审核模块、人工分类模块、自动分类纠正模块、已分类试题数据库以及同类题目查找模块;所述自动分类模块,用于将待分类试题数据库中的试题与标签库的标签进行匹配,并将匹配后的试题传送至待审核试题数据库;所述人工审核模块,用于审核试题自动分类的正确性,若自动分类正确将试题传送至已分类试题数据库,若自动分类错误则将试题传送至人工分类模块;所述人工分类模块,用于将自动分类错误的试题与标签库的标签进行匹配,若标签库存在与试题匹配的标签,直接将试题与该标签进行匹配,若标签库不存在与试题匹配的标签,则创造新的标签与试题匹配,并将新的标签加入至标签库中,匹配后的试题传送至分类试题数据库;所述自动分类纠正模块用于提高自动分类模块的正确性;所述同类题目查找模块用于将分类试题数据库的试题进一步进行分类。本专利技术在自动分类试题时候,将高正确率的标签特征词集合取代低正确率的标签特征词集合,将不断提高分类的正确性;提取出试题中的试题特征词以及标签中的标签特征词,利用K近邻算法找出对应标签,极大的提高了对试题分类的速度;建立一个完善的人工审核机制,保证了对题库分类的准确性。本实施例所述的一种试题自动分类方法,包括以下步骤:步骤A:自动分类模块将待分类试题数据库中的试题与标签库的标签进行匹配,并将匹配后的试题传送至待审核试题数据库;步骤B:人工审核模块对待审核试题数据库的自动分类试题进行审核,若自动分类正确将试题传送至已分类试题数据库,若自动分类错误则将试题传送至人工分类模块;步骤C:人本文档来自技高网...

【技术保护点】
1.一种试题自动分类系统,其特征在于:包括待分类试题数据库、自动分类模块、标签库、待审核试题数据库、人工审核模块、人工分类模块、自动分类纠正模块、已分类试题数据库以及同类题目查找模块;所述自动分类模块,用于将待分类试题数据库中的试题与标签库的标签进行匹配,并将匹配后的试题传送至待审核试题数据库;所述人工审核模块,用于审核试题自动分类的正确性,若自动分类正确将试题传送至已分类试题数据库,若自动分类错误则将试题传送至人工分类模块;所述人工分类模块,用于将自动分类错误的试题与标签库的标签进行匹配,若标签库存在与试题匹配的标签,直接将试题与该标签进行匹配,若标签库不存在与试题匹配的标签,则创造新的标签与试题匹配,并将新的标签加入至标签库中,匹配后的试题传送至分类试题数据库;所述自动分类纠正模块用于提高自动分类模块的正确性;所述同类题目查找模块用于将分类试题数据库的试题进一步进行分类。

【技术特征摘要】
1.一种试题自动分类系统,其特征在于:包括待分类试题数据库、自动分类模块、标签库、待审核试题数据库、人工审核模块、人工分类模块、自动分类纠正模块、已分类试题数据库以及同类题目查找模块;所述自动分类模块,用于将待分类试题数据库中的试题与标签库的标签进行匹配,并将匹配后的试题传送至待审核试题数据库;所述人工审核模块,用于审核试题自动分类的正确性,若自动分类正确将试题传送至已分类试题数据库,若自动分类错误则将试题传送至人工分类模块;所述人工分类模块,用于将自动分类错误的试题与标签库的标签进行匹配,若标签库存在与试题匹配的标签,直接将试题与该标签进行匹配,若标签库不存在与试题匹配的标签,则创造新的标签与试题匹配,并将新的标签加入至标签库中,匹配后的试题传送至分类试题数据库;所述自动分类纠正模块用于提高自动分类模块的正确性;所述同类题目查找模块用于将分类试题数据库的试题进一步进行分类。2.一种利用权利要求1所述的试题自动分类系统的分类方法,其特征在于:包括以下步骤:步骤A:自动分类模块将待分类试题数据库中的试题与标签库的标签进行匹配,并将匹配后的试题传送至待审核试题数据库;步骤B:人工审核模块对待审核试题数据库的自动分类试题进行审核,若自动分类正确将试题传送至已分类试题数据库,若自动分类错误则将试题传送至人工分类模块;步骤C:人工分类模块将自动分类错误的试题与标签库的标签进行匹配,若标签库存在与试题匹配的标签,直接将试题与该标签进行匹配,若标签库不存在与试题匹配的标签,则创造新的标签与试题匹配,并将新的标签加入至标签库中,匹配后的试题传送至分类试题数据库;步骤D:自动分类纠正模块根据自动分类的准确性以及人工分类的准确性从而反馈至自动分类模块中提高自动分类模块的准确性;。步骤E:同类题目查找模块...

【专利技术属性】
技术研发人员:涂旭平郑兆清胡孝义
申请(专利权)人:东莞市七宝树教育科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1