【技术实现步骤摘要】
本申请实施例涉及上机考试的,尤其涉及一种上机考试题库查重方法和系统。
技术介绍
1、随着在线教育和计算机辅助教学的普及,上机考试题库的管理和维护变得越来越重要。上机考试题库通常包含大量的编程题目、选择题、填空题等,这些题目需要定期更新和维护,以确保考试的公平性和有效性。在题库管理中,查重是一项关键任务,目的是发现和剔除重复或高度相似的题目,避免考试内容的重复出现,提高题库的多样性和挑战性。
2、目前,上机考试题库查重主要依赖于人工审查和简单的文本匹配方法。人工审查耗时耗力,且由于主观因素的影响可能导致误判;而简单的文本匹配方法只能检测到完全一致或高度相似的文本内容。因此,现有的查重方法无法满足上机考试题库快速更新的需求,且存在较高的误报率和漏报率。
技术实现思路
1、本申请实施例提供一种上机考试题库查重方法和系统,用以解决
技术介绍
中存在的问题。
2、第一方面,本申请实施例中提供了一种上机考试题库查重方法,包括:利用上机考试题库中的题目,对题目内容进行语义理解和上下文关联分析,得到题目之间的多维度相似性图谱,其中,所述多维度相似性图谱用于表征题目的文字表述相似度,以及题目的解题思路、知识领域和逻辑结构的相似度; 基于所述多维度相似性图谱,采用高级图谱分析技术,对题目间的关联关系进行处理,得到相似度矩阵,其中,所述相似度矩阵用于表征题目间的相似性;利用所述相似度矩阵,通过聚类算法对所述上机考试题库中的题目进行聚类,得到题目群组,其中,所述题目群组为题目间在多个维
3、进一步的,利用上机考试题库中的题目,对题目内容进行语义理解和上下文关联分析,得到题目之间的多维度相似性图谱,包括:对所述上机考试题库中的题目进行自然语言处理,并结合所述题目中的非文本元素,生成所述题目的基础语义信息,其中,所述基础语义信息包括:分词结果,词性标注,实体名称,分词之间的语法关系和所述非文本元素;根据所述题目的基础语义信息,利用深度学习模型对所述题目进行语义理解,生成所述题目的语义向量表示;基于所述题目的语义向量表示和所述题目的元数据信息,运用图嵌入技术,对所述题目间的关系进行多维度相似性分析,生成题目之间的初始多维度相似性图谱,其中,所述元数据包括:所述题目对应的知识领域和所述题目的难度等级;利用图神经网络算法,对所述初始多维度相似性图谱进行分析,得到所述多维度相似性图谱。
4、进一步的,利用图神经网络算法,对所述初始多维度相似性图谱进行分析,得到所述多维度相似性图谱,包括:利用所述初始多维度相似性图谱,对预设图神经网络模型进行训练,得到训练后的图神经网络模型;利用所述训练后的图神经网络模型,对所述初始多维度相似性图谱中的节点的特征向量进行更新,并通过更新后的节点特征向量计算节点间的相似性,得到相似性得分;利用所述相似性得分,生成所述多维度相似性图谱。
5、进一步的,基于所述多维度相似性图谱,采用高级图谱分析技术,对题目间的关联关系进行处理,得到相似度矩阵,包括:基于所述多维度相似性图谱,构建所述题目之间的关联图谱,其中,所述关联图谱中的节点为所述题目,所述题目之间的相似性作为所述关联图谱的边,所述关联图谱的边的权重由题目的多模态语义向量表示的相似度决定;基于所述关联图谱,应用图卷积网络算法,对所述关联图谱中的节点和边进行迭代处理,通过多次卷积操作聚合邻近节点的信息,生成所述增强后的关联图谱;根据所述增强后的关联图谱,并利用注意力机制,动态调整所述增强后的关联图谱中节点间相似度的权重,并基于调整后的权重,生成综合相似度信息;利用所述综合相似度信息,计算出所述题目之间的最终相似度得分,生成所述相似度矩阵。
6、进一步的,利用所述相似度矩阵,通过聚类算法对所述上机考试题库中的题目进行聚类,得到题目群组,包括:利用预设聚类算法和所述相似度矩阵对所述上机考试题库中的题目进行聚类,得到初始题目群组;利用自适应阈值调整机制,对所述初始题目群组进行优化,得到所述题目群组。
7、进一步的,其特征在于,根据所述增强后的关联图谱,并利用注意力机制,动态调整所述增强后的关联图谱中节点间相似度的权重,并基于调整后的权重,生成综合相似度信息,包括:利用所述增强后的关联图谱,对注意力机制进行初始化处理,生成注意力权重矩阵和偏置项;基于所述注意力权重矩阵和偏置项,对所述增强后的关联图谱中每个节点与临近节点之间的相似性进行评估处理,生成节点间的注意力权重;基于所述节点间的注意力权重,对所述增强后的关联图谱中节点间的相似度权重进行动态调整处理,生成调整后的相似度权重;利用调整后的相似度权重,对所述增强后的关联图谱中的相似度权重进行更新处理,生成相似度权重矩阵;根据相似度权重矩阵,对题目之间的相似性进行分析处理,生成综合相似度信息;
8、基于综合相似度信息,构建所述综合相似度信息矩阵。
9、进一步的,所述综合相似度信息的计算公式:
10、;
11、其中,表示题目和题目之间的综合相似度,为第种相似度因素的权重,为题目和题目在第种相似度因素下的相似度得分,为注意力机制下第种因素对题目和题目相似度的影响系数,,为激活函数,题目和题目在第种相似度因素下的相似度得分,为自适应阈值调整参数,相似度因素的数量。
12、第二方面,本申请实施例提供了一种上机考试题库查重系统,包括:第一分析单元,用于利用上机考试题库中的题目,对题目内容进行语义理解和上下文关联分析,得到题目之间的多维度相似性图谱,其中,所述多维度相似性图谱用于表征题目的文字表述相似度,以及题目的解题思路、知识领域和逻辑结构的相似度; 第二分析单元,用于基于所述多维度相似性图谱,采用高级图谱分析技术,对题目间的关联关系进行处理,得到相似度矩阵,其中,所述相似度矩阵用于表征题目间的相似性;聚类单元,用于利用所述相似度矩阵,通过聚类算法对所述上机考试题库中的题目进行聚类,得到题目群组,其中,所述题目群组为题目间在多个维度上的相似度大于预设阈值的题目集合; 查重单元,用于利用所述题目群组,对题库中的题目进行查重处理,生成题库查重报告,所述查重报告包括:所述题目群组中的题目列表和所述题目群组中的题目的相似性评分。
13、第三方面,本申请实施例提供了一种计算设备,包括处理组件以及存储组件;所述存储组件存储一个或多个计算机指令;所述一个或多个计算机指令用以被所述处理组件调用执行,实现如上述第一方面所述的方法。
14、第四方面,本申请实施例提供了一种计算机存储介质,存储有计算机程序,所述计算机程序被计算机执行时,实现如上述第一方面所述的方法。
15、在本专利技术实施例中,利用上机考试题库中的题目,对题目内容进行语义理解和上下文关联分析,得到题目之间的多维度相似性图谱; 基于所述多维度相似性图本文档来自技高网...
【技术保护点】
1.一种上机考试题库查重方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,利用上机考试题库中的题目,对题目内容进行语义理解和上下文关联分析,得到题目之间的多维度相似性图谱,包括:
3.根据权利要求2所述的方法,其特征在于,利用图神经网络算法,对所述初始多维度相似性图谱进行分析,得到所述多维度相似性图谱,包括:
4.根据权利要求1所述的方法,其特征在于,基于所述多维度相似性图谱,采用高级图谱分析技术,对题目间的关联关系进行处理,得到相似度矩阵,包括:
5.根据权利要求1所述的方法,其特征在于,利用所述相似度矩阵,通过聚类算法对所述上机考试题库中的题目进行聚类,得到题目群组,包括:
6.根据权利要求4所述的方法,其特征在于,根据所述增强后的关联图谱,并利用注意力机制,动态调整所述增强后的关联图谱中节点间相似度的权重,并基于调整后的权重,生成综合相似度信息,包括:
7.根据权利要求6所述的方法,其特征在于,
8.一种上机考试题库查重系统,其特征在于,包括:
9.一种计算设备
10.一种计算机存储介质,其特征在于,存储有计算机程序,所述计算机程序被计算机执行时,实现如权利要求1至7任一项所述的方法。
...【技术特征摘要】
1.一种上机考试题库查重方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,利用上机考试题库中的题目,对题目内容进行语义理解和上下文关联分析,得到题目之间的多维度相似性图谱,包括:
3.根据权利要求2所述的方法,其特征在于,利用图神经网络算法,对所述初始多维度相似性图谱进行分析,得到所述多维度相似性图谱,包括:
4.根据权利要求1所述的方法,其特征在于,基于所述多维度相似性图谱,采用高级图谱分析技术,对题目间的关联关系进行处理,得到相似度矩阵,包括:
5.根据权利要求1所述的方法,其特征在于,利用所述相似度矩阵,通过聚类算法对所述上机考试题库中的题目进行聚类,得到题目群组,包括:...
【专利技术属性】
技术研发人员:姚志峰,吉永栋,何柳,
申请(专利权)人:全美在线北京科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。