本发明专利技术提供了一种学生作业场景下的框题方法及装置、终端设备及存储介质,其中,学生作业场景下的框题方法包括:获取包含待框选题目的目标图片;分别对目标图片中的各级题目序号、各题目序号对应的题目区域及题目行区域进行检测;将检测得到的题目序号、各题目序号对应的题目区域及题目行区域信息进行融合,确定各题目序号对应的最终题目区域范围;对最高一级题目序号对应的题目区域进行文字识别及语义分类,得到各题的框选范围标志;根据框选范围标志对图片中的各个题目进行框选。该框题方法尤其适用于目标图片中试卷、练习册、书本等出现倾斜或拱起的情况,保证框选的结果内容齐全,提升框题效率,对后续业务起到很好的支撑作用。作用。作用。
【技术实现步骤摘要】
学生作业场景下的框题方法及装置、终端设备及存储介质
[0001]本专利技术涉及图像处理
,尤指一种学生作业场景下的框题方法及装置、终端设备及存储介质。
技术介绍
[0002]目前,应用于学生作业场景下,帮助学生做题或批改的APP越来越受欢迎。为了更好地满足业务需求,如何对试卷、练习册、书本等拍摄图片中包含的题目区域进行精确定位成了整个技术链路关键的一环。
[0003]由于学生学习场景多变,拍摄时环境光线、摄像头与纸张的相对位置、纸张的凹凸程度等都会产生一定程度的变化,对于上述问题的解决形成了很大的挑战。当前方案商处理时一般会存在两大问题:1)框选的题目区域为矩形,对于拍摄目标出现倾斜或拱起时效果较差,容易出现多框或少框的情况;2)同一个完整的题目中可能包含多个不同级别题目序号的题目区域,造成题目框选结果不佳。
技术实现思路
[0004]本专利技术的目的是提供一种学生作业场景下的框题方法及装置、终端设备及存储介质,有效解决现有框题方法对于目标图片中题目出现倾斜/拱起,或目标图片中包含多个不同级别题目序号的题目区域时框选效果不佳的技术问题。
[0005]本专利技术提供的技术方案如下:
[0006]本专利技术提供了一种学生作业场景下的框题方法,包括:
[0007]获取包含待框选题目的目标图片;
[0008]分别对所述目标图片中的各级题目序号、各题目序号对应的题目区域及题目行区域进行检测;
[0009]将检测得到的题目序号、各题目序号对应的题目区域及题目行区域信息进行融合,确定各题目序号对应的最终题目区域范围;
[0010]对最高一级题目序号对应的题目区域进行文字识别及语义分类,得到各题的框选范围标志;
[0011]根据所述框选范围标志对图片中的各个题目进行框选。
[0012]在本技术方案中,分别对目标图片中的题目序号、各题目序号对应的题目区域及题目行区域进行检测,并融合得到各题目序号对应的最终题目区域范围,避免由于题目区域检测过程中出现错框、漏框影响区域检测的准确率,提高框题效率。另外,确定了各题目序号对应的最终题目区域范围之后,通过对最高一级题目序号对应的题目区域进行文字识别和语义分类,以此确定是框大题还是框小题,避免出现框选错误的情况。该框题方法尤其适用于目标图片中试卷、练习册、书本等出现倾斜或拱起的情况,保证框选的结果内容齐全,对后续业务起到很好的支撑作用。
[0013]进一步优选地,所述分别对所述目标图片中的各级题目序号、各题目序号对应的
题目区域及题目行区域进行检测包括并行执行以下步骤:
[0014]对目标图片中的各级题目序号进行定位并识别,得到各级题目序号;
[0015]将各级题目序号对应的题目区域作为一个整体并沿题目边沿进行分割,得到各题目序号对应的题目区域;
[0016]将题目中的每行文字作为一个整体进行分割,得到题目行区域。
[0017]进一步优选地,所述将检测得到的题目序号、各题目序号对应的题目区域及题目行区域信息进行融合,确定各题目序号对应的最终题目区域范围包括:
[0018]将所述题目序号和题目行区域信息与所述题目区域信息进行匹配;
[0019]当出现不匹配信息,根据所述题目序号和/或题目行区域信息对所述题目区域进行调整,确定各题目序号对应的最终题目区域范围。
[0020]在本技术方案中,充分利用AI算法的提取特征能力,依次提取了题目序号、各题目序号对应的题目区域及题目行区域信息之后充分发挥信息融合的作用,使整个框题算法达到优秀的框题效果。
[0021]进一步优选地,所述对最高一级题目序号对应的题目区域进行文字识别及语义分类,得到各题的框选范围标志包括:
[0022]将包含最高一级题目序号对应的题目区域送入文字识别工具中进行文字识别;
[0023]对识别的文字进行语义分类,并根据分类结果计算语义间的关联度;
[0024]将计算得到的语义关联度与预设关联阈值进行比较;
[0025]根据比较结果输出题目的框选范围标志。
[0026]在本技术方案中,通过对最高一级题目序号对应的题目区域进行文字识别和语义分类,输出相应的框选范围标志,以此后续根据该框选范围标志对题目区域进行框选,极大程度上避免了错误框选的情况出现。尤其在处理题目中包含多级题目序号的情况,能够正确地框选出需要的题目区域。
[0027]进一步优选地,所述框选范围标志包括:框选包含最高一级题目序号对应题目区域的标志及框选不包含最高一级题目序号对应题目区域的标志;
[0028]当计算得到的语义关联度小于预设关联阈值,输出框选不包含最高一级题目序号对应题目区域的标志;
[0029]当计算得到的语义关联度大于等于预设关联阈值,输出框选包含最高一级题目序号对应题目区域的标志。
[0030]本专利技术还提供了一种学生作业场景下的框题装置,包括:
[0031]图片获取模块,用于获取包含待框选题目的目标图片;
[0032]检测模块,用于分别对所述图片获取模块获取的目标图片中的各级题目序号、各题目序号对应的题目区域及题目行区域进行检测;
[0033]信息融合模块,用于将所述检测模块检测得到的题目序号、各题目序号对应的题目区域及题目行区域信息进行融合,确定各题目序号对应的最终题目区域范围;
[0034]语义分析模块,用于分别对所述信息融合模块确定的包含最高一级题目序号对应的题目区域进行文字识别及语义分类,得到各题的框选范围标志;
[0035]题目框选模块,用于根据所述语义分析模块输出的框选范围标志对图片中的各个题目进行框选。
[0036]在本技术方案中,分别对目标图片中的题目序号、各题目序号对应的题目区域及题目行区域进行检测,并融合得到各题目序号对应的最终题目区域范围,避免由于题目区域检测过程中出现错框、漏框影响区域检测的准确率,提高框题效率。另外,确定了各题目序号对应的最终题目区域范围之后,通过对最高一级题目序号对应的题目区域进行文字识别和语义分类,以此确定是框大题还是框小题,避免出现框选错误的情况。该框题方法尤其适用于目标图片中试卷、练习册、书本等出现倾斜或拱起的情况,保证框选的结果内容齐全,对后续业务起到很好的支撑作用。
[0037]进一步优选地,所述检测模块中包括:
[0038]题目序号检测单元,用于对目标图片中的各级题目序号进行定位并识别,得到各级题目序号;
[0039]题目区域检测单元,用于将各级题目序号对应的题目区域作为一个整体并沿题目边沿进行分割,得到各题目序号对应的题目区域;
[0040]题目行检测单元,用于将题目中的每行文字作为一个整体进行分割,得到题目行区域。
[0041]在本技术方案中,充分利用AI算法的提取特征能力,依次提取了题目序号、各题目序号对应的题目区域及题目行区域信息之后充分发挥信息融合的作用,使整个框题算法达到优秀的框题效果。
[0042]进一本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种学生作业场景下的框题方法,其特征在于,包括:获取包含待框选题目的目标图片;分别对所述目标图片中的各级题目序号、各题目序号对应的题目区域及题目行区域进行检测;将检测得到的题目序号、各题目序号对应的题目区域及题目行区域信息进行融合,确定各题目序号对应的最终题目区域范围;对最高一级题目序号对应的题目区域进行文字识别及语义分类,得到各题的框选范围标志;根据所述框选范围标志对图片中的各个题目进行框选。2.如权利要求1所述的框题方法,其特征在于,所述分别对所述目标图片中的各级题目序号、各题目序号对应的题目区域及题目行区域进行检测包括并行执行以下步骤:对目标图片中的各级题目序号进行定位并识别,得到各级题目序号;将各级题目序号对应的题目区域作为一个整体并沿题目边沿进行分割,得到各题目序号对应的题目区域;将题目中的每行文字作为一个整体进行分割,得到题目行区域。3.如权利要求1或2所述的框题方法,其特征在于,所述将检测得到的题目序号、各题目序号对应的题目区域及题目行区域信息进行融合,确定各题目序号对应的最终题目区域范围包括:将所述题目序号和题目行区域信息与所述题目区域信息进行匹配;当出现不匹配信息,根据所述题目序号和/或题目行区域信息对所述题目区域进行调整,确定各题目序号对应的最终题目区域范围。4.如权利要求1或2所述的框题方法,其特征在于,所述对最高一级题目序号对应的题目区域进行文字识别及语义分类,得到各题的框选范围标志包括:将包含最高一级题目序号对应的题目区域送入文字识别工具中进行文字识别;对识别的文字进行语义分类,并根据分类结果计算语义间的关联度;将计算得到的语义关联度与预设关联阈值进行比较;根据比较结果输出题目的框选范围标志。5.如权利要求4所述的框题方法,其特征在于,所述框选范围标志包括:框选包含最高一级题目序号对应题目区域的标志及框选不包含最高一级题目序号对应题目区域的标志;当计算得到的语义关联度小于预设关联阈值,输出框选不包含最高一级题目序号对应题目区域的标志;当计算得到的语义关联度大于等于预设关联阈值,输出框选包含最高一级题目序号对应题目区域的标志。6.一种学生作业场景下的框题装置,其特征在于,包括:图片获取模块,用于获取包含待框选题目的目标图片;检测模块,用于分别对所述图片获取模块获取的目标图片中的各级题目序号、各题目序号对应的题目区域及题目行区域进行检测;信息融合模块,用于将所述检测模块检测得到的题目序号、各题目序号对应的题目区...
【专利技术属性】
技术研发人员:胡东平,洪锦奇,杨宗武,
申请(专利权)人:广东小天才科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。