对包含算式的图像进行处理的方法和装置制造方法及图纸

技术编号：22642869 阅读：47 留言：0更新日期：2019-11-26 16:26

本申请公开了对包含算式的图像进行处理的方法和装置。所述方法包括：对所述包含算式的图像进行预处理；所述预处理包括：从所述包含算式的图像中去除干扰线，得到中间图像，以及对所述中间图像进行字符切割处理，得到包含顺序的多幅字符图像；基于预置的字符识别模型对各字符图像分别进行识别，得到相应的识别结果；基于所述识别结果以及所述顺序确定数学算式，对所述数学算式进行相应的计算，得到计算结果。该技术方案考虑到了包含算式的图像的特点，通过去除干扰线来提高后续字符切割的准确率以及字符图像的识别率，并基于确定的数学算式自动、快速地进行解答，能够给出数学习题、算式验证码等的答案，节省了人工劳动。

Method and device for processing image containing formula

The application discloses a method and a device for processing an image including a formula. The method includes: preprocessing the image containing the formula; the preprocessing includes: removing the interference line from the image containing the formula, obtaining the intermediate image, and character cutting the intermediate image to obtain a plurality of character images including the sequence; recognizing each character image based on the preset character recognition model, and obtaining the corresponding Recognition result: determine the mathematical formula based on the recognition result and the order, and calculate the corresponding mathematical formula to get the calculation result. The technical scheme takes into account the characteristics of the image containing the formula, improves the accuracy of the subsequent character cutting and the recognition rate of the character image by removing the interference line, and solves automatically and quickly based on the determined mathematical formula, which can give the answers of the mathematical exercises, the formula verification code, etc., and saves the labor.

全部详细技术资料下载

【技术实现步骤摘要】
对包含算式的图像进行处理的方法和装置
本申请涉及图像处理
，具体涉及对包含算式的图像进行处理的方法和装置。
技术介绍
目前，包含算式的图像在许多场景得到了应用，例如，许多网站和APP都需要用户输入验证码进行人机安全验证，所采用的验证码图像就是包含算式的图像，用户需要输入算式的答案；又例如中小学数据运算题目也可以以图片方式展示，等等。因此需要一种能够对包含算式的图像进行处理的手段，帮助人们自动获得算式的答案。
技术实现思路
鉴于上述问题，提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的对包含算式的图像进行处理的方法和装置。依据本申请的一个方面，提供了一种对包含算式的图像进行处理的方法，包括：对所述包含算式的图像进行预处理；所述预处理包括：从所述包含算式的图像中去除干扰线，得到中间图像，以及对所述中间图像进行字符切割处理，得到包含顺序的多幅字符图像；基于预置的字符识别模型对各字符图像分别进行识别，得到相应的识别结果；基于所述识别结果以及所述顺序确定数学算式，对所述数学算式进行相应的计算，得到计算结果。可选地，所述从所述包含算式的图像中去除干扰线包括：对所述包含算式的图像执行颜色空间转换，将预设的阈值范围作为过滤条件，基于所述过滤条件去除干扰线的颜色区域。可选地，所述对所述中间图像进行字符切割处理包括：基于所述中间图像在x轴方向上的投影得到像素分布，根据所述像素分布进行字符切割处理。可选地，所述字符识别模型是基...

【技术保护点】
1.一种对包含算式的图像进行处理的方法，其特征在于，该方法包括：/n对所述包含算式的图像进行预处理；所述预处理包括：从所述包含算式的图像中去除干扰线，得到中间图像，以及对所述中间图像进行字符切割处理，得到包含顺序的多幅字符图像；/n基于预置的字符识别模型对各字符图像分别进行识别，得到相应的识别结果；/n基于所述识别结果以及所述顺序确定数学算式，对所述数学算式进行相应的计算，得到计算结果。/n

【技术特征摘要】
1.一种对包含算式的图像进行处理的方法，其特征在于，该方法包括：
对所述包含算式的图像进行预处理；所述预处理包括：从所述包含算式的图像中去除干扰线，得到中间图像，以及对所述中间图像进行字符切割处理，得到包含顺序的多幅字符图像；
基于预置的字符识别模型对各字符图像分别进行识别，得到相应的识别结果；
基于所述识别结果以及所述顺序确定数学算式，对所述数学算式进行相应的计算，得到计算结果。

2.如权利要求1所述的方法，其特征在于，所述从所述包含算式的图像中去除干扰线包括：
对所述包含算式的图像执行颜色空间转换，将预设的阈值范围作为过滤条件，基于所述过滤条件去除干扰线的颜色区域。

3.如权利要求1所述的方法，其特征在于，所述对所述中间图像进行字符切割处理包括：
基于所述中间图像在x轴方向上的投影得到像素分布，根据所述像素分布进行字符切割处理。

4.如权利要求1所述的方法，其特征在于，所述字符识别模型是基于深度卷积神经网络训练得到的；其中，在训练过程中使用的训练数据是对字符图像进行图像聚类后标注得到的，所述字符图像是对包含算式的样本图像进行所述预处理后得到的。

5.如权利要求4所述的方法，其特征在于，所述图像聚类包括：
将字符图像在主成分上的投影系数作为字符图像的特征向量，利用k均值聚类算法对字符图像进行聚类，得到一级图像类簇；
将字符图像的方向梯度直方图特征作为字符图像的特征向量，利用k均值聚类算法对各一级图像类簇中的字符图像进行聚类，得到二级图像类簇；
对各二级图像类簇中的字符图像，基于dHash算法，计算各图像间的汉明距离，根...

【专利技术属性】
技术研发人员：潘惊治，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人