一种试题检测识别方法、装置、电子设备及介质制造方法及图纸

技术编号：27320750 阅读：7 留言：0更新日期：2021-02-10 10:01

本发明专利技术提供一种试题检测识别方法、装置、电子设备及介质，属于网络智能教育技术领域。试题检测识别方法包括以下步骤：获取目标图像；通过模型检测算法，生成第一检测结果，第一检测结果包括题目信息检测结果和答案信息检测结果；利用OCR模型识别第一检测结果，得到第一识别结果，第一识别结果包括文字行识别结果和公式识别结果；将第一识别结果与数据库中预设的试题模板数据进行匹配，根据相似度输出批改结果。本发明专利技术针对目标图像采用模型检测算法，生成题目信息检测结果和答案信息检测结果，分别对两个检测结果进行OCR模型识别，识别出文字行识别结果和公式识别结果，提高对试题题目和答案中图表、公式的检测识别效率，进而提高批改效率。提高批改效率。提高批改效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种试题检测识别方法、装置、电子设备及介质

[0001]本专利技术属于网络智能教育
，尤其涉及一种试题检测识别方法、装置、电子设备及介质。

技术介绍

[0002]随着计算机技术的发展，线上教学得到了快速的发展，相应的一些教学工具类产品也应运而生，为学生、老师、家长提供教育辅导上的技术支持和帮助，很多教学工具类产品都能提供将题目拍照或者截图进行批改的功能。
[0003]拍照或者截图批改最重要的就是识别过程，目前的批改工具产品无法直接处理如小学低年级图形类、初中公式类题目的批改，对图形类、公式类的题目批改大多是通过以图搜图的方式来解决，但是以图搜图的方法只有当题库中有对应的题目和题解时，才能进行题目的批改；而图形类的题型通常数量庞大，类别复杂，当题库中的题目数量较少时，搜索检测结果不佳，无法得到准确的答案；当题库中的题目数量较多时，通常会带来搜索检测效率低下，搜索检测耗时长等问题，因此题库搜索的方式非常依赖题库的指令和以图搜图算法的优劣，批改效率低。

技术实现思路

[0004]本专利技术的目的在于克服上述现有技术存在的不足，提供一种试题检测识别方法、装置、电子设备及介质，解决了现有技术中在批改具有图形和/或公式的题目时批改效率低下的问题，克服了必须以扩大题库存储数据的方式才能进行批注的技术瓶颈。
[0005]为了实现上述目的，第一方面，本专利技术提供一种试题检测识别方法，包括以下步骤：
[0006]步骤S1：获取目标图像；
[0007]步骤S2：通过模型检测算法，生成...

【技术保护点】

【技术特征摘要】
1.一种试题检测识别方法，其特征在于，包括以下步骤：步骤S1：获取目标图像；步骤S2：通过模型检测算法，生成第一检测结果，所述第一检测结果包括题目信息检测结果和答案信息检测结果；步骤S3：利用OCR模型识别所述第一检测结果，得到第一识别结果，所述第一识别结果包括文字行识别结果和公式识别结果；步骤S4：将所述第一识别结果与数据库中预设的试题模板数据进行匹配，根据相似度输出批改结果。2.如权利要求1所述的试题检测识别方法，其特征在于，在步骤S2和S3中，基于深度学习方法，使用仿真程序自动化生成预设模型，所述预设模型包括文字行检测模型、公式检测模型、图表检测模型和文字行识别模型、公式识别模型；其中，根据文字行检测模型、公式检测模型、图表检测模型对所述目标图像执行第一动作，并生成第一检测结果，所述第一动作包括对目标图像进行目标区域的分离提取；根据文字行识别模型、公式识别模型对第一检测结果执行第二动作，并得到第一识别结果，所述第二动作包括对包含相应目标区域的题目信息检测结果和答案信息检测结果进行字符识别。3.如权利要求2所述的试题检测识别方法，其特征在于，在使用仿真程序自动化生成预设模型过程中，自动生成训练数据，所述训练数据与真实样本数据高度相似，所述训练数据包括图表数据、文字行数据、公式数据及label数据，所述训练数据通过随机模式生成。4.如权利要求2至3任一项所述的试题检测识别方法，其特征在于，在步骤S2中，在生成题目信息检测结果和/或答案信息检测结果过程中，包括利用图表检测模型对所述目标图像进行图表区域的分离提取，包括：使用轻量级的SSD-Mobilenetv2网络作为图表检测网络，输入图像大小为224X224，使用Mobilenetv2作为主干网络提取特征，基于SSD的多层特征分别对所述目标图像中的图表区域进行检测，得到所述图表区域对应的位置坐标信息。5.如权利要求4所述的试题检测识别方法，其特征在于，在步骤S2中，在生成题目信息检测结果和/或答案信息检测结果过程中，包括利用文字行检测模型对所述目标图像进行文本区域的分离提取，包括：基于分割场景文本的检测方法，将所产生的热力图转化为边界框和文字区域，其中包含二值化的后处理过程，所述二值化的后处理过程通过将二值化操作插入到分割网络中进行组合优化，使热力图各处阈值自适应，得到所述文本区域对应的位置坐标信息。6.如权利要求5所述的试题检测识别方法，其特征在于，在步骤S2中，在生成题目信息检测结果和/或答案信息检测结果过程中，包括利用公式检测模型对所述文本区域进行文字区域和公式区域的分离提取，包括：使用CTPN算法作为公式检测网络，获取所述文本区域，对所述文本区域进行公式检测，得到文本区域中文字区域对应的位置坐标信息和公式区域对应的位置坐标信息。7.如权利要求6所述的试题检测识别方法，其特征在于，根据所述文字区域对应的位置坐标信息和公式区域对应的位置坐标信息，分别单独分隔提取出所述文字区域和公式区域，将所述文字区域输入至文字识别引擎进行识别，并得到文字行识别结果；将所述公式区域输入至公式识别引擎进行识别，并得到...

【专利技术属性】
技术研发人员：孙永毫，徐强，
申请(专利权)人：广东国粒教育技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人