The application discloses a method and a device for processing an image including a formula. The method includes: preprocessing the image containing the formula; the preprocessing includes: removing the interference line from the image containing the formula, obtaining the intermediate image, and character cutting the intermediate image to obtain a plurality of character images including the sequence; recognizing each character image based on the preset character recognition model, and obtaining the corresponding Recognition result: determine the mathematical formula based on the recognition result and the order, and calculate the corresponding mathematical formula to get the calculation result. The technical scheme takes into account the characteristics of the image containing the formula, improves the accuracy of the subsequent character cutting and the recognition rate of the character image by removing the interference line, and solves automatically and quickly based on the determined mathematical formula, which can give the answers of the mathematical exercises, the formula verification code, etc., and saves the labor.
【技术实现步骤摘要】
对包含算式的图像进行处理的方法和装置
本申请涉及图像处理
,具体涉及对包含算式的图像进行处理的方法和装置。
技术介绍
目前,包含算式的图像在许多场景得到了应用,例如,许多网站和APP都需要用户输入验证码进行人机安全验证,所采用的验证码图像就是包含算式的图像,用户需要输入算式的答案;又例如中小学数据运算题目也可以以图片方式展示,等等。因此需要一种能够对包含算式的图像进行处理的手段,帮助人们自动获得算式的答案。
技术实现思路
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的对包含算式的图像进行处理的方法和装置。依据本申请的一个方面,提供了一种对包含算式的图像进行处理的方法,包括:对所述包含算式的图像进行预处理;所述预处理包括:从所述包含算式的图像中去除干扰线,得到中间图像,以及对所述中间图像进行字符切割处理,得到包含顺序的多幅字符图像;基于预置的字符识别模型对各字符图像分别进行识别,得到相应的识别结果;基于所述识别结果以及所述顺序确定数学算式,对所述数学算式进行相应的计算,得到计算结果。可选地,所述从所述包含算式的图像中去除干扰线包括:对所述包含算式的图像执行颜色空间转换,将预设的阈值范围作为过滤条件,基于所述过滤条件去除干扰线的颜色区域。可选地,所述对所述中间图像进行字符切割处理包括:基于所述中间图像在x轴方向上的投影得到像素分布,根据所述像素分布进行字符切割处理。可选地,所述字符识别模型是基 ...
【技术保护点】
1.一种对包含算式的图像进行处理的方法,其特征在于,该方法包括:/n对所述包含算式的图像进行预处理;所述预处理包括:从所述包含算式的图像中去除干扰线,得到中间图像,以及对所述中间图像进行字符切割处理,得到包含顺序的多幅字符图像;/n基于预置的字符识别模型对各字符图像分别进行识别,得到相应的识别结果;/n基于所述识别结果以及所述顺序确定数学算式,对所述数学算式进行相应的计算,得到计算结果。/n
【技术特征摘要】
1.一种对包含算式的图像进行处理的方法,其特征在于,该方法包括:
对所述包含算式的图像进行预处理;所述预处理包括:从所述包含算式的图像中去除干扰线,得到中间图像,以及对所述中间图像进行字符切割处理,得到包含顺序的多幅字符图像;
基于预置的字符识别模型对各字符图像分别进行识别,得到相应的识别结果;
基于所述识别结果以及所述顺序确定数学算式,对所述数学算式进行相应的计算,得到计算结果。
2.如权利要求1所述的方法,其特征在于,所述从所述包含算式的图像中去除干扰线包括:
对所述包含算式的图像执行颜色空间转换,将预设的阈值范围作为过滤条件,基于所述过滤条件去除干扰线的颜色区域。
3.如权利要求1所述的方法,其特征在于,所述对所述中间图像进行字符切割处理包括:
基于所述中间图像在x轴方向上的投影得到像素分布,根据所述像素分布进行字符切割处理。
4.如权利要求1所述的方法,其特征在于,所述字符识别模型是基于深度卷积神经网络训练得到的;其中,在训练过程中使用的训练数据是对字符图像进行图像聚类后标注得到的,所述字符图像是对包含算式的样本图像进行所述预处理后得到的。
5.如权利要求4所述的方法,其特征在于,所述图像聚类包括:
将字符图像在主成分上的投影系数作为字符图像的特征向量,利用k均值聚类算法对字符图像进行聚类,得到一级图像类簇;
将字符图像的方向梯度直方图特征作为字符图像的特征向量,利用k均值聚类算法对各一级图像类簇中的字符图像进行聚类,得到二级图像类簇;
对各二级图像类簇中的字符图像,基于dHash算法,计算各图像间的汉明距离,根...
【专利技术属性】
技术研发人员:潘惊治,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。