【技术实现步骤摘要】
解题模型的训练方法及装置
[0001]本说明书涉及人工智能
,特别涉及一种解题模型的训练方法。本说明书同时涉及一种解题模型的训练装置,一种解题方法,一种解题装置,一种计算设备,以及一种计算机可读存储介质。
技术介绍
[0002]随着人工智能技术的发展和自然语言处理技术的不断成熟,实际应用中通常使用智能解题模型实现对各类问题的解答。
[0003]然而,目前通过智能解题模型解答的问题主要集中于语言类问题,例如翻译文本、文章理解等,但是对于数学领域的问题,由于数学题目不仅包含文本语句,还包含数学符号和数字,使得目前的智能解题模型难以理解数学领域的问题,导致对数学领域的问题解题准确率较低,因此亟需一种有效的方案以解决上述问题。
技术实现思路
[0004]有鉴于此,本说明书实施例提供了一种解题模型的训练方法。本说明书同时涉及一种解题模型的训练装置,一种解题方法,一种解题装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面,提供了一种解题模型的训练方法,包括:
[0006]获取题干样本,以及所述题干样本对应的数字算式;
[0007]提取所述题干样本中的数字单元,确定所述数字单元对应的字符标记单元;
[0008]根据所述字符标记单元更新所述数字算式,获得样本字符表达式;
[0009]利用所述样本字符表达式和所述题干样本对初始解题模型进行训练,直至获得满足训练停止条件的目标解题模型。
[ ...
【技术保护点】
【技术特征摘要】
1.一种解题模型的训练方法,其特征在于,包括:获取题干样本,以及所述题干样本对应的数字算式;提取所述题干样本中的数字单元,确定所述数字单元对应的字符标记单元;根据所述字符标记单元更新所述数字算式,获得样本字符表达式;利用所述样本字符表达式和所述题干样本对初始解题模型进行训练,直至获得满足训练停止条件的目标解题模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述字符标记单元更新所述数字算式,获得样本字符表达式步骤执行之前,还包括:确定所述数字单元在所述题干样本中的顺序;根据所述数字单元在所述题干样本中的顺序,对所述字符标记单元进行排序;相应的,根据所述字符标记单元更新所述数字算式,获得样本字符表达式,包括:根据排序后的字符标记单元更新所述数字算式,获得样本字符表达式。3.根据权利要求1所述的方法,其特征在于,所述根据所述字符标记单元更新所述数字算式,获得样本字符表达式,包括:确定所述数字算式中的算式数字单元,其中,所述算式数字单元与所述数字单元相对应;确定所述数字单元和所述字符标记单元之间的映射关系;基于所述映射关系,将所述算式数字单元替换为所述字符标记单元,获得样本字符表达式。4.根据权利要求1所述的方法,其特征在于,所述利用所述样本字符表达式和所述题干样本对初始解题模型进行训练,直至获得满足训练停止条件的目标解题模型,包括:将所述题干样本输入至所述初始解题模型进行处理,得到预测字符表达式;基于所述样本字符表达式和所述预测字符表达式对所述初始解题模型进行优化,直至获得满足训练停止条件的目标解题模型。5.根据权利要求4所述的方法,其特征在于,所述将所述题干样本输入至所述初始解题模型进行处理,得到预测字符表达式,包括:将所述题干样本输入至所述初始解题模型,通过所述初始解题模型中的编码器对所述题干样本进行编码处理,得到编码向量;通过所述初始解题模型中的解码器对所述编码向量进行解码处理,得到预测字符表达式并输出所述初始解题模型;其中,所述预测字符表达式包括运算符号和预测字符标记单元。6.根据权利要求5所述的方法,其特征在于,所述通过所述初始解题模型中的解码器对所述编码向量进行解码处理,得到预测字符表达式并输出所述初始解题模型,包括:通过所述初始解题模型中的解码器对所述编码向量进行递归解码处理,依次输出多个预测字符,其中,所述解码器输出的当前预测字符关联所述当前预测字符的上相邻预测字符;根据所述多个预测字符生成所述预测字符表达式并输出所述初始解题模型。7.根据权利要求4所述的方法,其特征在于,所述基于所述样本字符表达式和所述预测字符表达式对所述初始解题模型进行优化,直至获得满足训练停止条件的目标解题模型,
包括:基于所述目标字符表达式和所述预测字符表达式计算模型损失值;在所述模型损失值大于预设阈值的情况下,根据所述模型损失值,调整所述初始解题模型的模型参数,继续训练模型参数调整后的初始解题模型,直至获得满...
【专利技术属性】
技术研发人员:刘洋,柳景明,赵薇,翁秋洁,张天宇,
申请(专利权)人:北京飞象星球科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。