基于试题配图的试题搜索方法、系统、存储介质及设备技术方案

技术编号:35499090 阅读:23 留言:0更新日期:2022-11-05 17:03
本发明专利技术公开了一种基于试题配图的试题搜索方法、系统、存储介质及设备,该方法包括:获取当前试题中的配图图像,并将配图图像输入至预训练的分类模型当中,以判断配图图像是否为坐标系图像;若是,则将配图图像分别输入至预训练的分割识别模型及特征提取模型当中,以得到当前试题配图的配图特征以及坐标符号;根据坐标符号查找与坐标符号相似的目标图像特征库,并获取配图特征与目标图像特征库中的各个图像特征之间的相似度;若否,获取当前试题配图的配图特征;并获取配图特征与预设的非坐标系图像特征库的各个图像特征之间的相似度;根据相似度确定与当前试题相关的推荐试题。本发明专利技术解决了现有技术中在为当前试题推荐类似试题时不准确的问题。题时不准确的问题。题时不准确的问题。

【技术实现步骤摘要】
基于试题配图的试题搜索方法、系统、存储介质及设备


[0001]本专利技术涉及智能教育
,特别涉及一种基于试题配图的试题搜索方法、系统、存储介质及设备。

技术介绍

[0002]随着教育以及人工智能的发展,教育和人工智能也实现了有机结合,特别是对于用于检测的试题出题方面,人们已经不仅仅局限于通过人工对试题进行推送,现如今,大部分都在采用智能算法对试题进行智能推送,例如,针对做题者应答的当前试题智能推送与考点类似的推荐试题。
[0003]现有的试题搜索主要基于试题文本,根据输入的文本内容或者对试题进行文本识别,进行字符级别的搜索来推送类似试题,例如,获取待搜索的试题,输入试题的文本内容或者输入整张试题图片并对整张图片进行字符识别,对输入或者识别得到的文本信息作为关键词在题库系统中进行搜索,以找到相似的试题。
[0004]然而,对整张试题图片文字识别,受图像质量影响大,模糊图像文字识别容易错误,导致试题语义被曲解,从而搜索错误,纯文本形式检索,文本信息作为关键字,会存在大量文本虽然相似,但是完全不相关的考点试题,导致搜索精度偏低,需要大量人工校验,因此,无论是对整张试题图片文字识别还是根据试题的文本信息进行识别的方式,均会存在试题推荐不准确的问题。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种基于试题配图的试题搜索方法、系统、存储介质及设备,旨在解决现有技术中在为当前试题推荐类似试题时不准确的问题。
[0006]本专利技术实施例是这样实现的:一种基于试题配图的试题搜索方法,所述方法包括:获取当前试题中的配图图像,并将所述配图图像输入至预训练的分类模型当中,以判断所述配图图像是否为坐标系图像;若是,则将所述配图图像分别输入至预训练的分割识别模型及特征提取模型当中,以得到所述当前试题配图的配图特征以及坐标符号;根据所述坐标符号在预设的坐标系图像特征库中查找与所述坐标符号相似的目标图像特征库,并获取所述配图特征与目标图像特征库中的各个图像特征之间的相似度;若否,则将所述配图图像输入至预训练的特征提取模型当中,以得到所述当前试题配图的配图特征;获取所述配图特征与预设的非坐标系图像特征库的各个图像特征之间的相似度;根据所述相似度从所述预设的坐标系图像特征库和预设的非坐标系图像特征库确定与所述当前试题相关的推荐试题。
[0007]进一步的,上述基于试题配图的试题搜索方法,其中,所述获取当前试题中的配图
图像,并将所述配图图像输入至预训练的分类模型当中,以判断所述配图图像是否为坐标系图像的步骤之前还包括:收集预设数量的试题配图图像,将所述试题配图图像分为坐标系图像和非坐标系图像,并将所述坐标系图像和非坐标系图像输入至第一预设神经网络进行深度学习训练得到所述分类模型;对所述坐标系图像标注横纵坐标符号,并将标注后的所述坐标系图像输入至第二预设神经网络进行深度学习训练得到所述分割识别模型;按照图像相似度对所述试题配图图像进行分类,并将分类后的所述试题配图图像通过深度学习模型迁移学习训练得到特征提取模型。
[0008]进一步的,上述基于试题配图的试题搜索方法,其中,所述根据所述相似度从所述预设的坐标系图像特征库和预设的非坐标系图像特征库确定与所述当前试题相关的推荐试题的步骤之前还包括:获取所述当前试题的推荐数量,并根据所述推荐数量确定所述当前试题对应的相似度阈值;根据所述相似度从所述预设的坐标系图像特征库和预设的非坐标系图像特征库确定与所述当前试题相关的推荐试题的步骤包括:将所述相似度大于所述相似度阈值的图像特征对应的试题确定为所述当前试题相关的推荐试题。
[0009]进一步的,上述基于试题配图的试题搜索方法,其中,所述将所述相似度大于所述相似度阈值的图像特征对应的试题确定为所述当前试题相关的推荐试题的步骤之后还包括:根据所述相似度的大小将所述当前试题相关的推荐试题从高到低的顺序依次进行排序。
[0010]进一步的,上述基于试题配图的试题搜索方法,其中,所述获取当前试题中的配图图像,并将所述配图图像输入至预训练的分类模型当中,以判断所述配图图像是否为坐标系图像的步骤之前还包括:获取题库中试题中的所有配图,将所述所有配图分为坐标系配图和非坐标配图;分别提取所述坐标系配图和非坐标配图中的图片特征以及对应的特征试题建立所述预设的坐标系图像特征库与预设的非坐标系图像特征库。
[0011]进一步的,上述基于试题配图的试题搜索方法,其中,所述分别提取所述坐标系配图和非坐标配图中的图片特征以及对应的特征试题建立所述预设的坐标系图像特征库与预设的非坐标系图像特征库的步骤之后还包括:当所述当前试题的所述配图图像为坐标系图像时,将所述当前试题配图的配图特征、坐标符号以及对应的试题信息输入至所述预设的坐标系图像特征库以对所述预设的坐标系图像特征库进行更新;当所述当前试题的所述配图图像为非坐标系图像时,将所述当前试题配图的配图特征以及对应的试题信息输入至所述预设的非坐标系图像特征库以对所述预设的非坐标系图像特征库进行更新。
[0012]进一步的,上述基于试题配图的试题搜索方法,其中,所述获取当前试题中的配图
图像,并将所述配图图像输入至预训练的分类模型当中,以判断所述配图图像是否为坐标系图像的步骤包括:获取当前试题中的配图图像,将所述当前试题的配图图像进行预处理,并将预处理后的所述配图图像输入至预训练的分类模型当中,以判断所述配图图像是否为坐标系图像;其中,所述预处理至少包括去噪、数据增强、大小变化以及将所述配图图像的尺寸调整为预设大小。
[0013]本专利技术的另一方面在于提供一种基于试题配图的试题搜索方法的系统,所述系统包括:配图图像获取模块,用于获取当前试题中的配图图像,并将所述配图图像输入至预训练的分类模型当中,以判断所述配图图像是否为坐标系图像;第一配图特征获取模块,用于当判断到所述配图图像为坐标系图像时,则将所述配图图像分别输入至预训练的分割识别模型及特征提取模型当中,以得到所述当前试题配图的配图特征以及坐标符号;第一相似度获取模块,用于根据所述坐标符号在预设的坐标系图像特征库中查找与所述坐标符号相似的目标图像特征库,并获取所述配图特征与目标图像特征库中的各个图像特征之间的相似度;第二配图特征获取模块,用于当判断到所述配图图像为非坐标系图像时,则将所述配图图像输入至预训练的特征提取模型当中,以得到所述当前试题配图的配图特征;第二相似度获取模块,用于获取所述配图特征与预设的非坐标系图像特征库的各个图像特征之间的相似度;推荐模块,用于根据所述相似度从所述预设的坐标系图像特征库和预设的非坐标系图像特征库确定与所述当前试题相关的推荐试题。
[0014]本专利技术实施例的另一个目的是提供一种可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的方法的步骤。
[0015]本专利技术实施例的另一个目的是提供一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的方法的步骤。
[0016]本专利技术实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于试题配图的试题搜索方法,其特征在于,所述方法包括:获取当前试题中的配图图像,并将所述配图图像输入至预训练的分类模型当中,以判断所述配图图像是否为坐标系图像;若是,则将所述配图图像分别输入至预训练的分割识别模型及特征提取模型当中,以得到所述当前试题配图的配图特征以及坐标符号;根据所述坐标符号在预设的坐标系图像特征库中查找与所述坐标符号相似的目标图像特征库,并获取所述配图特征与目标图像特征库中的各个图像特征之间的相似度;若否,则将所述配图图像输入至预训练的特征提取模型当中,以得到所述当前试题配图的配图特征;获取所述配图特征与预设的非坐标系图像特征库的各个图像特征之间的相似度;根据所述相似度从所述预设的坐标系图像特征库和预设的非坐标系图像特征库确定与所述当前试题相关的推荐试题。2.根据权利要求1所述的基于试题配图的试题搜索方法,其特征在于,所述获取当前试题中的配图图像,并将所述配图图像输入至预训练的分类模型当中,以判断所述配图图像是否为坐标系图像的步骤之前还包括:收集预设数量的试题配图图像,将所述试题配图图像分为坐标系图像和非坐标系图像,并将所述坐标系图像和非坐标系图像输入至第一预设神经网络进行深度学习训练得到所述分类模型;对所述坐标系图像标注横纵坐标符号,并将标注后的所述坐标系图像输入至第二预设神经网络进行深度学习训练得到所述分割识别模型;按照图像相似度对所述试题配图图像进行分类,并将分类后的所述试题配图图像通过深度学习模型迁移学习训练得到特征提取模型。3.根据权利要求1所述的基于试题配图的试题搜索方法,其特征在于,所述根据所述相似度从所述预设的坐标系图像特征库和预设的非坐标系图像特征库确定与所述当前试题相关的推荐试题的步骤之前还包括:获取所述当前试题的推荐数量,并根据所述推荐数量确定所述当前试题对应的相似度阈值;根据所述相似度从所述预设的坐标系图像特征库和预设的非坐标系图像特征库确定与所述当前试题相关的推荐试题的步骤包括:将所述相似度大于所述相似度阈值的图像特征对应的试题确定为所述当前试题相关的推荐试题。4.根据权利要求3所述的基于试题配图的试题搜索方法,其特征在于,所述将所述相似度大于所述相似度阈值的图像特征对应的试题确定为所述当前试题相关的推荐试题的步骤之后还包括:根据所述相似度的大小将所述当前试题相关的推荐试题从高到低的顺序依次进行排序。5.根据权利要求1所述的基于试题配图的试题搜索方法,其特征在于,所述获取当前试题中的配图图像,并将所述配图图像输入至预训练的分类模型当中,以判断所述配图图像是否为坐标系图像的步骤之前还包括:
获取题库中试题中的所有配图,将所述所有配图分为坐标系配图和非坐标配图;分别提取所述坐标系配图...

【专利技术属性】
技术研发人员:刘凡谢德刚
申请(专利权)人:江西风向标智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1