一种基于图像识别的试题搜索方法和系统技术方案

技术编号:30968342 阅读:28 留言:0更新日期:2021-11-25 20:43
本发明专利技术提供一种基于图像识别的试题搜索方法和系统,涉及互联网试题搜索技术领域。该基于图像识别的试题搜索方法和系统,拍摄照片并识别图像内容中的文字以及公式代码和阿拉伯数字,利用文字分离的方式达到了避免公式代码和阿拉伯数字被直接删除,利用中文的纯文本形式检索出与试题的出题语序检索出十分靠近的内容,利用删选模块对整体内容进行集中整合并且按照与试题文本契合度最高的节奏进行删选,利用排序模块和推送模块对原有的公式代码和阿拉伯数字与上一步骤中排序完成的试题进行比对后,选择出契合度更高的试题及解题思路参考答案进行推送,增加了数字分离结构和数学代码比对结果,达到了使题目答案或数值更加贴近搜索试题的目的。近搜索试题的目的。近搜索试题的目的。

【技术实现步骤摘要】
一种基于图像识别的试题搜索方法和系统


[0001]本专利技术涉及互联网试题搜索
,特别的为一种基于图像识别的试题搜索方法和系统。

技术介绍

[0002]试题搜索系统,可以让学生们享受到科技进步带来的便利和高效,对着习题用手机摄像头拍照上传,短短几秒钟,相应的答案和解答思路、解答过程等就会跳出屏幕,然而传统的搜索方式是通过提取图片中的中文字体与阿拉伯数字、数学代码等其它符号,随后将这几种符号直接导入库内搜索,由于文字搜索优先级不大于其它符号,可能导致其它符号影响中文搜索结果,从而使得搜索人员无法在搜题后第一时间得知答案,会造成用户流失等问题。

技术实现思路

[0003]本专利技术提供的专利技术目的在于提供一种基于图像识别的试题搜索方法和系统,解决上述
技术介绍
中的问题。
[0004]为实现以上目的,本专利技术通过以下技术方案予以实现:一种基于图像识别的试题搜索方法,包括:
[0005]拍摄照片并识别图像内容中的文字以及公式代码和阿拉伯数字;
[0006]将图像内容中的文字部分转码成为文字信息输入至题库中进行基础检索;
[0007]对检索结果根据文字内容选出子序列契合度最高的前五十题目并进行排序;
[0008]通过将公式代码以及阿拉伯数依次输入至上一步骤排序的前五十题中进行检索,选择出与公式代码以及阿拉伯数字内容契合度最高题目并进行重新排列,将搜索到的试题排序完成后对终端推送检索结果。
[0009]优选的,所述识别图像内容中的文字以及公式代码和阿拉伯数字包括:
[0010]直接对自然光情况下的目标照片进行拍摄;
[0011]或根据照片亮度以及拍摄内容与环境光的对比度具体参数打开调节灯进行补光拍摄。
[0012]优选的,识别图像内容中的文字以及公式代码和阿拉伯数字包括:
[0013]将图片内容分解为纯文字文本进行输出;
[0014]或将图片内容分解问纯文字文本和公式代码以及阿拉伯文字进行输出。
[0015]优选的,所述对检索结果根据文字内容选出子序列契合度最高的前五十题目并进行排序包括:
[0016]将图片识别后的纯文字文本按照词语重合度进行排序;
[0017]或将图片识别后的纯文字文本按照句式重合度进行排序。
[0018]优选的,所述通过将公式代码以及阿拉伯数依次输入至上一步骤排序的前五十题中进行检索,选择出与公式代码以及阿拉伯数字内容契合度最高题目并进行重新排列,将
搜索到的试题排序完成后对终端推送检索结果包括:
[0019]推送与图片识别内容重合度最高的试题;或
[0020]推送与图片识别内容重复度最高的试题及试题的答案和解析。
[0021]一种基于图像识别的试题搜索系统,包括:图片摄取模块、图片接收模块、文字识别模块、文字提取模块、检索模块、删选模块、排序模块和推送模块;
[0022]所述图片摄取模块用于对需要识别的题目转换为图片格式导入文字识别模块中;
[0023]所述图片接收模块用于对已经转换为图片格式的试题导入文字识别模块中;
[0024]所述文字识别模块用于对导入的图片的文字内容进行扫描并识别;
[0025]所述文字提取模块用于对文字识别模块扫描的文字内容进行删选和分离;
[0026]所述检索模块用于对扫描的纯文本文字与题库中的试题进行文字比对并选出文本契合度较高的试题;
[0027]所述删选模块用于对检索模块筛选出的试题与文字提取模块中储存的阿拉伯数字以及数学代码进行比对并进一步进行删选;
[0028]所述排序模块用于将删选模块选出的契合度最高的试题根据契合度进行排名后按照列表的形式展现;
[0029]所述推送模块用于将排序且比对后的试题按照契合度所制作的列表进行展示。
[0030]优选的,所述图片摄取模块包括:补光灯、光敏传感器、摄像头、集中处理单元和文字清晰度识别模块,所述摄像头用于对需要进行拍摄的试题做摄像处理,所述光敏传感器用于对摄像头拍摄时光源敏感度进行分析后决定是否需要进行补光,所述补光灯用于对试题进行补光,所述集中处理单元用于对摄像头拍摄的内容进行格式转换处理,所述文字清晰度识别模块用于对图片内容的文字进行分析判定。
[0031]优选的,所述补光灯与光敏传感器电性连接,所述光敏传感器与摄像头电性连接,所述摄像头与集中处理单元电性连接,所述集中处理单元与文字清晰度识别模块电性连接,所述文字清晰度识别模块与文字识别模块电性连接。
[0032]优选的,所述图片摄取模块与文字识别模块电性连接,所述图片接收模块与文字识别模块电性连接,所述文字识别模块与文字提取模块电性连接,所述文字提取模块与检索模块电性连接,所述检索模块与删选模块电性连接,所述删选模块与排序模块电性连接,所述排序模块与推送模块电性连接。
[0033]本专利技术提供了一种基于图像识别的试题搜索方法和系统。具备以下有益效果:拍摄照片并识别图像内容中的文字以及公式代码和阿拉伯数字,利用文字分离的方式达到了避免公式代码和阿拉伯数字被直接删除,利用中文的纯文本形式检索出与试题的出题语序检索出十分靠近的内容,利用删选模块对整体内容进行集中整合并且按照与试题文本契合度最高的节奏进行删选,利用排序模块和推送模块对原有的公式代码和阿拉伯数字与上一步骤中排序完成的试题进行比对后,选择出契合度更高的试题及解题思路参考答案进行推送,增加了数字分离结构和数学代码比对结果,达到了使题目答案或数值更加贴近搜索试题的目的。
附图说明
[0034]图1为本专利技术的系统图;
[0035]图2为本专利技术的图片摄取模块的系统图。
具体实施方式
[0036]为了便于本领域的普通技术人员能够理解并实施本专利技术,下面将结合附图对本专利技术实施例作进一步说明。
[0037]如图1

2所示:一种基于图像识别的试题搜索方法,包括:拍摄照片并识别图像内容中的文字以及公式代码和阿拉伯数字,此时采用图片摄取模块、图片接收模块和文字识别模块进行上述操作,其中图片摄取模块用于对需要识别的题目转换为图片格式导入文字识别模块中,同时图片接收模块用于对已经转换为图片格式的试题导入文字识别模块中,并且文字识别模块用于对导入的图片的文字内容进行扫描并识别,同时文字提取模块用于对文字识别模块扫描的文字内容进行删选和分离,该步骤用以达成图片中的文字识别以及图像提取,方便后续步骤依靠该提取数据进行运作;
[0038]将图像内容中的文字部分转码成为文字信息输入至题库中进行基础检索,此时采用文字提取模块进行上述操作,其中文字提取模块用于对文字识别模块扫描的文字内容进行删选和分离,该步骤用以达成对文字进行排序和分离处理,方便后续步骤依靠该分离出的数据进行比对运作;
[0039]对检索结果根据文字内容选出子序列契合度最高的前五十题目并进行排序,此时采用检索模块进行上述操作,其中检索模块用于对扫描的纯文本文字与题库中的试题进行文字比对并本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图像识别的试题搜索方法,其特征在于,包括:拍摄照片并识别图像内容中的文字以及公式代码和阿拉伯数字;将图像内容中的文字部分转码成为文字信息输入至题库中进行基础检索;对检索结果根据文字内容选出子序列契合度最高的前五十题目并进行排序;通过将公式代码以及阿拉伯数依次输入至上一步骤排序的前五十题中进行检索,选择出与公式代码以及阿拉伯数字内容契合度最高题目并进行重新排列,将搜索到的试题排序完成后对终端推送检索结果。2.根据权利要求1所述的一种基于图像识别的试题搜索方法,其特征在于:所述识别图像内容中的文字以及公式代码和阿拉伯数字包括:直接对自然光情况下的目标照片进行拍摄;或根据照片亮度以及拍摄内容与环境光的对比度具体参数打开调节灯进行补光拍摄。3.根据权利要求2所述的一种基于图像识别的试题搜索方法,其特征在于:识别图像内容中的文字以及公式代码和阿拉伯数字包括:将图片内容分解为纯文字文本进行输出;或将图片内容分解问纯文字文本和公式代码以及阿拉伯文字进行输出。4.根据权利要求3所述的一种基于图像识别的试题搜索方法,其特征在于:所述对检索结果根据文字内容选出子序列契合度最高的前五十题目并进行排序包括:将图片识别后的纯文字文本按照词语重合度进行排序;或将图片识别后的纯文字文本按照句式重合度进行排序。5.根据权利要求4所述的一种基于图像识别的试题搜索方法,其特征在于:所述通过将公式代码以及阿拉伯数依次输入至上一步骤排序的前五十题中进行检索,选择出与公式代码以及阿拉伯数字内容契合度最高题目并进行重新排列,将搜索到的试题排序完成后对终端推送检索结果包括:推送与图片识别内容重合度最高的试题;或推送与图片识别内容重复度最高的试题及试题的答案和解析。6.一种基于图像识别的试题搜索系统,其特征在于,包括:图片摄取模块、图片接收模块、文字识别模块、文字提取模块、检索模块、删选模块、排序模块和推送模块;所述图片摄取...

【专利技术属性】
技术研发人员:郑贤娇张博文
申请(专利权)人:深圳市亚太未来教育科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1