题目识别方法、装置、设备及介质制造方法及图纸

技术编号：29527583 阅读：64 留言：0更新日期：2021-08-03 15:14

本发明专利技术涉及图像处理技术领域，特别适用于图像信息识别，针对题目图像的单题功能无法识别包含多题的情况，使用繁琐，由此提出了本发明专利技术的题目识别方法、装置、设备及介质，旨在解决如何对任意的题目影像能进行快速简易的单题或多题识别处理的技术问题。为此，本发明专利技术的方法通过对任意的题目图像基于提取题号信息、预测文本多题概率以及长文本基于句子的相似度模型识别三种方式的融合以确定该图像是否为多题情况，以在单题识别发现为多题时提示用户转多题功。由此，无论用户提供的题目图像是多题还是单题，都能在本发明专利技术扩展的单题搜索模式下获得正确的题目识别结果，更便于用户使用、提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
题目识别方法、装置、设备及介质
本专利技术属于图像处理
，特别适用于图像信息识别，更具体的是涉及题目识别方法、装置、设备及介质。本专利技术中所称的题目是指包括但不限于练习册、答题卡、答题卷、作业本、习题链接页面下等各种具有多项或单项的题目。
技术介绍
现有技术中，已知的通过线上或线下进行非人工实现的题目识别技术，往往需要图像识别和处理技术的支持，一种方式例如：采集试卷的图像后，系统自动定位、识别、统分和记录，从而有效提高统分的准确性并降低人力工作量；又例如：通过手持拍照设备根据拍照指令按照拍照焦距执行拍照操作得到题目图片，由此能够通过手持拍照设备同时拍取多道题目并上传搜索，操作便捷，搜题效率高。但已有的识别方式，需要采集图像的特殊定位要求，各种设置、拍摄要求和算法进行配合，新的题目格式出现又需要新的设置调整；或者需要按照拍摄时的各种范围规范长时间尝试拍摄符合要求的影像/图片/图像，操作繁琐不便尤其不方便用户。因此，本申请提出一种解决方案，至少解决上述问题、实现多种拍搜模式，提供便于用户的功能，提高搜题效率和使用便利性，用户的体验，降低计算和网络资源的负担
技术实现思路
(一)要解决的技术问题本专利技术旨在至少解决如何对任意的题目影像进行快速简易的单项/单个题目或多项/多个题目实现识别处理的技术问题；进一步，解决了无需用户自身预判搜索题目功能而自动完成判断以提升题目识别的效率和使用的便捷性，从而能适应更广泛年龄的用户即无需拍摄对用户年龄和操作能力形成限制，提升用户的体验...

【技术保护点】
1.一种题目识别方法，其特征在于，包括：/n对获取到的题目图像进行识别，判断所述图像是否为包含多题目的多题图像；/n如果是，则提示用户进入多题搜索模式，以对所述多题图像进行识别；/n输出相应题目的处理结果。/n

【技术特征摘要】
1.一种题目识别方法，其特征在于，包括：
对获取到的题目图像进行识别，判断所述图像是否为包含多题目的多题图像；
如果是，则提示用户进入多题搜索模式，以对所述多题图像进行识别；
输出相应题目的处理结果。

2.根据权利要求1所述的题目识别方法，其特征在于，
判断所述图像是否为包含多题目的多题图像，包括以下至少一种识别处理方式：
基于规则识别所述图像是否为多题图像；
基于文本分类模型识别所述图像是否为多题图像；
基于句子相似度模型识别所述图像是否为多题图像；
和/或，
判断所述图像是否为包含多个题目的多题图像，还包括：融合基于规则识别、基于文本分类模型识别以及基于句子相似度模型识别的判断结果，最终确定所述图像是否为多题图像。

3.根据权利要求1或2所述的题目识别方法，其特征在于，
所述基于规则识别，包括基于预先设定的题号规则进行识别；
可选地，所述基于文本分类模型识别，包括基于经训练后的预测模型预测所述图像的所述文本信息为多个题目的概率进行识别；
可选地，所述基于句子相似度模型识别，包括基于对文本信息中的长文本进行预定句子划分后预测各个句子之间的相似度以确定句子之间是否属于同一道题目进行识别。

4.根据权利要求3所述的题目识别方法，其特征在于，所述融合基于规则识别、基于文本分类模型识别以及基于句子相似度模型识别的判断结果，最终确定所述图像是否为多题图像，具体包括：
当任意一种识别处理中判断的结果为多题图像时，确定所述图像为多题图像；或者，
当任意两种预设的识别处理中判断的结果为多题图像时，确定所述图像为多题图像；或者，
当三种识别处理中判断的结果均为多题图像时，则确定所述图像为多题图像；或者，
按照条件依次执行三种识别处理，当任一种识别处理能够执行并有判断的结果为多题图像时，确定所述图像为多题图像。
<...

【专利技术属性】
技术研发人员：郭德强，匡柘溪，王岩，
申请(专利权)人：作业帮教育科技北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人