习题分析方法、装置、设备及存储介质制造方法及图纸

技术编号:36896628 阅读:13 留言:0更新日期:2023-03-18 09:17
本申请实施例公开了习题分析方法、装置、设备及存储介质,其包括:获取待求解习题;在习题库中查找所述待求解习题的至少一道第一相似习题,并获取第一相似习题的第一表达式;将所述待求解习题、所述第一相似习题以及对应的第一表达式输入至习题分析模型,由所述习题分析模型分析得到所述待求解习题的待求解表达式;根据所述待求解表达式得到所述待求解习题的习题答案。采用上述方法可以解决相关技术中采用匹配应用题计算表达式模板时,易出现应用题答案错误或无法计算应用题答案的技术问题。题答案错误或无法计算应用题答案的技术问题。题答案错误或无法计算应用题答案的技术问题。

【技术实现步骤摘要】
习题分析方法、装置、设备及存储介质


[0001]本申请实施例涉及文字处理
,尤其涉及一种习题分析方法、装置、设备及存储介质。

技术介绍

[0002]数学领域中,应用题自动解题任务是指通过给定的应用题题目,通过特定的技术方案(即解题过程)直接得到对应的答案。这种方式虽然能得到应用题的答案,但是忽略了解答环节的推理过程。为了在自动解题任务中明确推理过程,一些相关技术中,使用统计机器学习以及模板匹配的方法,通过应用题题目信息匹配到对应的应用题计算表达式模板,并根据应用题计算表达式模板计算得到应用题的答案。这种方法只在限定的应用题计算表达式模板下具有较好的效果,当无法匹配到应用题计算表达式模板时,将出现应用题答案错误或者无法计算应用题答案的情况,使得应用题自动解题任务的效果较差。

技术实现思路

[0003]本申请一个实施例提供了一种习题分析方法、装置、设备及存储介质,以解决相关技术中匹配应用题计算表达式模板时,易出现应用题答案错误或无法计算应用题答案的技术问题。
[0004]第一方面,本申请一个实施例提供了一种习题分析方法,包括:
[0005]获取待求解习题;
[0006]在习题库中查找所述待求解习题的至少一道第一相似习题,并获取所述第一相似习题的第一表达式;
[0007]将所述待求解习题、所述第一相似习题以及对应的第一表达式输入至习题分析模型,由所述习题分析模型分析得到所述待求解习题的待求解表达式;
[0008]根据所述待求解表达式得到所述待求解习题的习题答案。
[0009]第二方面,本申请实施例还提供了一种习题分析装置,包括:
[0010]获取模块,用于获取待求解习题;
[0011]查找模块,用于在习题库中查找所述待求解习题的至少一道第一相似习题,并获取所述第一相似习题的第一表达式;
[0012]分析模块,用于将所述待求解习题、所述第一相似习题以及对应的第一表达式输入至习题分析模型,由所述习题分析模型分析得到所述待求解习题的待求解表达式;
[0013]求解模块,用于根据所述待求解表达式得到所述待求解习题的习题答案。
[0014]第三方面,本申请实施例还提供了一种习题分析设备,包括:
[0015]一个或多个处理器;
[0016]存储器,用于存储一个或多个程序;
[0017]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的习题分析方法。
[0018]第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的习题分析方法。
[0019]在本申请一个实施例中,通过获取待求解习题,在习题库中查找待求解习题相似的第一相似习题和对应的第一表达式,之后,将待求解习题、第一相似习题和第一表达式输入至习题分析模型,可以得到待求解表达式,进而根据待求解表达式得到习题答案的技术手段,解决了匹配应用题计算表达式模板时,易出现应用题答案错误或无法计算应用题答案的技术问题。习题分析模型在解答待求解习题时,参考了检索到的第一相似习题以及第一表达式,提高了习题分析模型的求解能力,不易出现解答错误或者无法计算的情况。
附图说明
[0020]图1为本申请一个实施例提供的一种习题分析方法的流程图;
[0021]图2为本申请一个实施例提供的一种习题分析模型的训练方法流程图;
[0022]图3为本申请一个实施例提供的一种掩码矩阵示意图;
[0023]图4为本申请一个实施例提供的另一种掩码矩阵示意图;
[0024]图5为本申请一个实施例提供的一种习题分析装置的结构示意图;
[0025]图6为本申请一个实施例提供的一种习题分析设备的结构示意图。
具体实施方式
[0026]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
[0027]一些相关技术中,自从大规模应用题解题数据集math23k被公开后,基于深度学习的方法实现应用题自动解题任务开始广泛的出现。其中,深度学习是学习样本数据的内在规律和表示层次,其最终目标是让机器能够像人一样具有分析学习能力。基于循环神经网络的序列到序列模型是应用题自动解题任务中常用的深度学习方法。这种方式下,需要先将应用题解题数据集中的题目和计算表达式中出现的数字使用统一字符进行表示,得到表达式模板,之后,序列到序列模型训练完成后,将当前待求解的应用题题目进行编码得到编码向量,之后,利用序列到序列模型得到对应的计算表达式。这种方式下,通过表达式模板进行解题的模式与人类解答应用题的模式具有较大的差别,人类解题时先分析语义(即明确题目的描述以及题目和数字之间的关系),再根据语义进行解题。并且,通过表达式模板进行解题时,一种类型应用题只有一种固定的表达式模板,无法进行类比学习。
[0028]综上,本申请一个实施例提供一种习题分析方法、装置、设备及存储介质,不仅可以解决相关技术中匹配应用题计算表达式模板时易造成的应用题答案错误或无法计算应用题答案的技术问题,还可以对应用题进行自动解答时,仿照人类的答题模式,并且可以进行类比学习。
[0029]本申请一个实施例提供的习题分析方法可以由习题分析设备执行,该习题分析设备可以通过软件和/或硬件的方式实现,该习题分析设备可以是两个或多个物理实体构成,也可以是一个物理实体构成,当前对此不作限定。一个实施例中,习题分析设备可以是台式电脑、笔记本电脑、学习机、交互智能平板、服务器等具有数据处理和分析能力的电子设备。
[0030]示例性的,图1为本申请一个实施例提供的一种习题分析方法的流程图。参考图1,该习题分析方法具体包括:
[0031]步骤110、获取待求解习题。
[0032]待求解习题是指当前需要求解答案的习题。一个实施例中,待求解习题为数学应用题。待求解习题可以为一道或多道,当前对此不做限定。待求解习题的获取方式当前不作限定。例如,待求解习题为用户输入的习题。又如,待求解习题是拍照后通过文字识别(如光学字符识别)的方式获取的习题。再如,待求解习题是从互联网题库中查找的习题。可理解,当前获取的待求解习题主要是指习题的题目。
[0033]步骤120、在习题库中查找待求解习题的至少一道第一相似习题,并获取第一相似习题的第一表达式。
[0034]习题库包含大量习题和对应的计算表达式。其中,习题是指习题的题目,习题对应的计算表达式是指解答该习题时使用的数学计算公式。可选的,习题库还包括习题的答案。一个实施例中,习题库包含的习题类型至少包括数学应用题类型,还可选包括其他的类型。
[0035]示例性的,在习题库中,查找与待求解习题相似的至少一道习题,并将查找到的习题记为第一相似习题。一个实施例中,比较待求解习题和习题库中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种习题分析方法,其特征在于,包括:获取待求解习题;在习题库中查找所述待求解习题的至少一道第一相似习题,并获取所述第一相似习题的第一表达式;将所述待求解习题、所述第一相似习题以及对应的第一表达式输入至习题分析模型,由所述习题分析模型分析得到所述待求解习题的待求解表达式;根据所述待求解表达式得到所述待求解习题的习题答案。2.根据权利要求1所述的习题分析方法,其特征在于,所述习题分析模型由特征表示模型、类比学习模型和推理模型组成,所述将所述待求解习题、所述第一相似习题以及对应的第一表达式输入至习题分析模型,由所述习题分析模型分析得到所述待求解习题的待求解表达式包括:将所述第一相似习题和对应的第一表达式拼接得到第一拼接信息,每道所述第一相似习题对应一个第一拼接信息;利用特征表示模型分别提取所述待求解习题的第一语义信息和所述第一拼接信息的第二语义信息;将所述第一相似习题、对应的第一表达式和所述待求解习题拼接得到第二拼接信息,每道所述第一相似习题对应一个第二拼接信息;利用类比学习模型得到所述第二拼接信息的第三语义信息;由推理模型根据所述第一语义信息、所述第二语义信息和所述第三语义信息推理得到所述待求解习题的待求解表达式。3.根据权利要求1所述的习题分析方法,其特征在于,所述在习题库中查找所述待求解习题的至少一道第一相似习题包括:对所述待求解习题进行分词,得到所述待求解习题出现的全部第一词汇;在语料库中查找所述第一词汇对应的词向量;根据各所述第一词汇对应的词向量得到所述待求解习题的第一句向量;计算所述第一句向量与习题库中各习题的第二句向量之间的相似度,所述第二句向量根据所述语料库中的词向量确定;获取相似度最高的至少一个第二句向量,并将获取的第二句向量对应的习题作为查找到的第一相似习题。4.根据权利要求3所述的习题分析方法,其特征在于,还包括:对所述习题库中各习题进行分词,得到所述习题库中出现的全部第二词汇;利用向量化模型得到每个所述第二词汇对应的词向量,各所述词向量组成所述语料库;对所述习题中各第二词汇的词向量进行均值化,以得到所述习题的第二句向量。5.根据权利要求3所述的习题分析方法,其特征在于,所述第一句向量表示为:其中,表示待求解习题的第一句向量,K表示待求解习题包含的第一词汇的总数量,D
表示语料库,V
nk
表示待求解习题中第k个第一词汇对应的词向量,V
nk
∈D表示在语料库中存在第k个第一词汇对应的词向量,Z
nj
表示待求解习题中第j个第一词汇对应的零向量,表示在语料库中不存在第j个第一词汇对应的词向量。6.根据权利要求2所述的习题分析方法,其特征在于,所述习题分析模型通过以下步骤训练得到:获取已求解习题和对应的已知表达式;在习题库中查找所述已求解习题的至少一道第二相似习题,并获取所述第二相似习题的第二表达式;将所述已求解习题和所述已知表达式拼接得到第三拼接信息,将所述第二相似习题和对应的第二表达式拼接得到第四拼接信息,每道所述第二相似习题对应一个第四拼接信息;利用所述特征表示模型分别提取所述第三拼接信息的第四语义信息和所述第四拼接信息的第五语义信息;将所述第二相似习题、对应的第二表达式、所述已求解习题和所述已知表达式拼接得到第五拼接信息,每道所述第二相似习题对应一个第五拼接信息;利用类比学习模型得到所述第五拼接信息的第六语义信息;由推理模型根据所述第四语义信息、所述第五语义信息和所述第六语义信息推理出所述已知表达式;根据推理出的所述已知表达式构建第一损失函数;根据所述第一损失函数更新所述习题分析模型的模型参数,直到所述第一损失函数收敛为止。7.根据权利要求6所述的习题分析方法,其特征在于,所述由推理模型根据所述第四语义信息、所述第五语义信息和所述第六语义信息推理出所述已知表达式时,还包括:由所述推理模型推理出所述第二表达式;根据推理出的所述第二表达式构建第二损失函数;所述根据所述第一损失函数更新所述习题分析模型的模型参数,直到所述第一损失函数收敛为止包括:根据所述第一损失函数和所述第二损失函数更新所述习题分析模型的模型参数,直到所述第一损失函数和所述第二损失函数收敛为止。8.根据权利要求6所述的习题分析方法,...

【专利技术属性】
技术研发人员:黄世锋
申请(专利权)人:广州视源人工智能创新研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1