试题处理方法及装置、计算机可读存储介质及电子设备制造方法及图纸

技术编号:33344842 阅读:31 留言:0更新日期:2022-05-08 09:37
本公开披露了一种试题处理方法及装置、计算机可读存储介质及电子设备,涉及自然语言处理技术领域。该试题处理方法包括:确定目标理科类试题的原始试题文本;利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据,其中,锚点数据为与目标理科类试题的考察内容关联的数据,锚点预测模型是基于M个理科类试题样本各自的解析试题文本和锚点标签数据训练得到的,M为正整数。本公开提供的试题处理方法,能够利用锚点预测模型精准地预测目标理科类试题对应的锚点数据,进而能够提升用户的学习效果和体验好感度。也就是说,与现有技术相比,本公开能够适用于理科类试题场景,且预测精准度更高。且预测精准度更高。且预测精准度更高。

【技术实现步骤摘要】
试题处理方法及装置、计算机可读存储介质及电子设备


[0001]本公开涉及自然语言处理
,具体涉及一种试题处理方法及装置、计算机可读存储介质及电子设备。

技术介绍

[0002]锚点标签作为学习机图谱的核心要素,能够直接影响用户掌握知识的程度。尤其是理科类试题,其锚点标签的重要性更是不言而喻。然而,由于理科类试题的原始试题文本中包含诸多难以被机器理解的公式以及专业术语等内容,因此,现有基于原始试题文本的锚点标签预测方法的精准度较差,极大影响了用户体验。

技术实现思路

[0003]有鉴于此,本公开提供一种试题处理方法及装置、计算机可读存储介质及电子设备,以解决相对于理科类试题而言,现有锚点标签预测方法的精准度较差的问题。
[0004]第一方面,本公开一实施例提供一种试题处理方法,该试题处理方法包括:确定目标理科类试题的原始试题文本;利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据,其中,锚点数据为与目标理科类试题的考察内容关联的数据,锚点预测模型是基于M个理科类试题样本各自的解析试题文本和锚点标签数据训练得到的,M为正整数。
[0005]结合第一方面,在第一方面的某些实现方式中,在利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据之前,该方法还包括:基于M个理科类试题样本各自的原始试题文本,生成M个理科类试题样本各自的解析试题文本,其中,原始试题文本包括题干文本;基于M个理科类试题样本各自的解析试题文本和锚点标签数据,训练初始网络模型,得到锚点预测模型。
[0006]结合第一方面,在第一方面的某些实现方式中,初始网络模型对应有全词遮蔽损失函数。基于M个理科类试题样本各自的解析试题文本和锚点标签数据,训练初始网络模型,得到锚点预测模型,包括:基于M个理科类试题样本各自的解析试题文本和全词遮蔽损失函数,预训练初始网络模型,得到预训练模型,其中,在预训练模型中,全词遮蔽损失函数满足预设收敛条件;基于M个理科类试题样本各自的解析试题文本和锚点标签数据,训练预训练模型,得到锚点预测模型。
[0007]结合第一方面,在第一方面的某些实现方式中,基于M个理科类试题样本各自的原始试题文本,生成M个理科类试题样本各自的解析试题文本,包括:针对M个理科类试题样本中的每个理科类试题样本,对理科类试题样本的原始试题文本进行正则处理,得到正则化试题文本;对正则化试题文本进行公式解析处理,得到理科类试题样本的解析试题文本。
[0008]结合第一方面,在第一方面的某些实现方式中,利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据,包括:基于目标理科类试题的原始试题文本,确定目标理科类试题对应的N个相关理科类试题,其中,N为正整数;确定N
个相关理科类试题各自的解析试题文本;利用锚点预测模型,基于N个相关理科类试题各自的解析试题文本,预测得到N个相关理科类试题各自对应的锚点数据;基于N个相关理科类试题各自对应的锚点数据,确定目标理科类试题对应的锚点数据。
[0009]结合第一方面,在第一方面的某些实现方式中,锚点预测模型包括基于题干的锚点预测模型和基于全题的锚点预测模型。利用锚点预测模型,基于N个相关理科类试题各自的解析试题文本,预测得到N个相关理科类试题各自对应的锚点数据,包括:针对N个相关理科类试题中的每个相关理科类试题,基于相关理科类试题的试题来源信息,确定相关理科类试题对应的锚点预测模型,其中,相关理科类试题对应的锚点预测模型为基于题干的锚点预测模型或基于全题的锚点预测模型;将相关理科类试题的解析试题文本输入相关理科类试题对应的锚点预测模型,得到相关理科类试题对应的锚点数据。
[0010]结合第一方面,在第一方面的某些实现方式中,锚点数据包括锚点标签数据和标签置信度数据。基于N个相关理科类试题各自对应的锚点数据,确定目标理科类试题对应的锚点数据,包括:基于N个相关理科类试题各自对应的锚点预测模型,确定基于全题的锚点预测模型对应的P个相关理科类试题,其中,P小于或等于N;若P为正整数,基于P个相关理科类试题各自对应的标签置信度数据和预设置信度条件,在P个相关理科类试题中挑选Q个相关理科类试题,其中,Q个相关理科类试题各自对应的标签置信度数据满足预设置信度条件,Q小于或等于P;基于Q个相关理科类试题各自对应的锚点标签数据,确定目标理科类试题对应的锚点数据。
[0011]结合第一方面,在第一方面的某些实现方式中,基于Q个相关理科类试题各自对应的锚点标签数据,确定目标理科类试题对应的锚点数据,包括:针对Q个相关理科类试题,确定标签置信度最高的相关理科类试题的数量;若标签置信度最高的相关理科类试题的数量为一个,则基于标签置信度最高的相关理科类试题对应的锚点标签数据,确定目标理科类试题对应的锚点数据;若标签置信度最高的相关理科类试题的数量为多个,则针对多个标签置信度最高的相关理科类试题各自对应的锚点标签数据,基于出现次数最高的锚点标签数据,确定目标理科类试题对应的锚点数据。
[0012]结合第一方面,在第一方面的某些实现方式中,在基于N个相关理科类试题各自对应的锚点预测模型,确定基于全题的锚点预测模型对应的P个相关理科类试题之后,该方法还包括:若P为零,则针对N个相关理科类试题各自对应的锚点标签数据,基于出现次数最高的锚点标签数据,确定目标理科类试题对应的锚点数据。
[0013]结合第一方面,在第一方面的某些实现方式中,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的N个相关理科类试题,包括:获取预设理科类试题题库;基于目标理科类试题的原始试题文本和预设理科类试题题库,确定N个相关理科类试题。
[0014]结合第一方面,在第一方面的某些实现方式中,确定目标理科类试题的原始试题文本,包括:获取目标理科类试题对应的试题图像;对试题图像进行字符识别操作,得到目标理科类试题的原始试题文本。
[0015]结合第一方面,在第一方面的某些实现方式中,M个理科类试题样本包括数学试题样本、物理试题样本和化学试题样本中的至少一种;和/或,锚点数据包括锚点标签数据,锚点数据还包括标签置信度数据。
[0016]结合第一方面,在第一方面的某些实现方式中,原始试题文本还包括知识点名称、
答案文本和答案解析文本中的至少一种文本。
[0017]第二方面,本公开一实施例提供一种锚点预测装置,该锚点预测装置包括:第一确定模块,用于确定目标理科类试题的原始试题文本;第二确定模块,用于利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据,其中,锚点数据为与目标理科类试题的考察内容关联的数据,锚点预测模型是基于M个理科类试题样本各自的解析试题文本和锚点标签数据训练得到的,M为正整数。
[0018]第三方面,本公开一实施例提供一种电子设备,该电子设备包括:处理器;用于存储处理器可执行指令的存储器,其中,处理器用于执行上述第一方面所提及本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种试题处理方法,其特征在于,包括:确定目标理科类试题的原始试题文本;利用锚点预测模型,基于所述目标理科类试题的原始试题文本,确定所述目标理科类试题对应的锚点数据,其中,所述锚点数据为与所述目标理科类试题的考察内容关联的数据,所述锚点预测模型是基于M个理科类试题样本各自的解析试题文本和锚点标签数据训练得到的,M为正整数。2.根据权利要求1所述的试题处理方法,其特征在于,在所述利用锚点预测模型,基于所述目标理科类试题的原始试题文本,确定所述目标理科类试题对应的锚点数据之前,还包括:基于所述M个理科类试题样本各自的原始试题文本,生成所述M个理科类试题样本各自的解析试题文本,其中,所述原始试题文本包括题干文本;基于所述M个理科类试题样本各自的解析试题文本和锚点标签数据,训练初始网络模型,得到所述锚点预测模型。3.根据权利要求2所述的试题处理方法,其特征在于,所述初始网络模型对应有全词遮蔽损失函数,所述基于所述M个理科类试题样本各自的解析试题文本和锚点标签数据,训练初始网络模型,得到所述锚点预测模型,包括:基于所述M个理科类试题样本各自的解析试题文本和所述全词遮蔽损失函数,预训练所述初始网络模型,得到预训练模型,其中,在所述预训练模型中,所述全词遮蔽损失函数满足预设收敛条件;基于所述M个理科类试题样本各自的解析试题文本和锚点标签数据,训练所述预训练模型,得到所述锚点预测模型。4.根据权利要求2或3所述的试题处理方法,其特征在于,所述基于所述M个理科类试题样本各自的原始试题文本,生成所述M个理科类试题样本各自的解析试题文本,包括:针对所述M个理科类试题样本中的每个理科类试题样本,对所述理科类试题样本的原始试题文本进行正则处理,得到正则化试题文本;对所述正则化试题文本进行公式解析处理,得到所述理科类试题样本的解析试题文本。5.根据权利要求1至3任一项所述的试题处理方法,其特征在于,所述利用锚点预测模型,基于所述目标理科类试题的原始试题文本,确定所述目标理科类试题对应的锚点数据,包括:基于所述目标理科类试题的原始试题文本,确定所述目标理科类试题对应的N个相关理科类试题,其中,N为正整数;确定所述N个相关理科类试题各自的解析试题文本;利用所述锚点预测模型,基于所述N个相关理科类试题各自的解析试题文本,预测得到所述N个相关理科类试题各自对应的锚点数据;基于所述N个相关理科类试题各自对应的锚点数据,确定所述目标理科类试题对应的锚点数据。6.根据权利要求5所述的试题处理方法,其特征在于,所述锚点预测模型包括基于题干的锚点预测模型和基于全题的锚点预测模型,所述利用所述锚点预测模型,基于所述N个相
关理科类试题各自的解析试题文本,预测得到所述N个相关理科类试题各自对应的锚点数据,包括:针对所述N个相关理科类试题中的每个相关理科类试题,基于所述相关理科类试题的试题来源信息,确定所述相关理科类试题对应的锚点预测模型,其中,所述相关理科类试题对应的锚点预测模型为所述基于题干的锚点预测模型或所述基于全题的锚点预测模型;将所述相关理科类试题的...

【专利技术属性】
技术研发人员:陈文哲苏喻张丹
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1