一种对图片进行文本识别的方法及移动终端技术

技术编号:17879546 阅读:28 留言:0更新日期:2018-05-06 01:11
一种对图片进行文本识别的方法及移动终端,包括:移动终端可以将移动终端中的图片进行二值化处理;移动终端还可以根据相邻像素之间的距离与指定阈值之间的大小关系可以将二值化图片中的黑色部分分别框选出来,得到至少一个目标框,该目标框中任意两个相邻像素点之间的距离小于或等于指定阈值;移动终端还能计算每个目标框的面积和中心点坐标,并根据相邻中心点坐标的距离与预设距离的大小关系将目标框分为噪点框集和文本框集两类集合;当文本框集的总面积大于噪点框集的总面积时,移动终端则可以对文本框集进行文本识别,以获取二值化图片中的题目信息。实施本发明专利技术实施例,能够提升对存在噪点较多的图片进行文本识别时的识别准确率。

A method for text recognition of pictures and mobile terminals

A method of text recognition for a picture and a mobile terminal, including: the mobile terminal can two value the picture in the mobile terminal; the mobile terminal can also frame the black part in the two valued picture according to the size relation between the distance between adjacent pixels and the specified threshold. At least one target box, the distance between any two adjacent pixels in the target box is less than or equal to the specified threshold. The mobile terminal can also calculate the area and center point coordinates of each target frame, and divide the target frame into the noise frame set and the text frame set two according to the relation between the distance of the adjacent central point coordinates and the preset distance. When the total area of the text frame set is larger than the total area of the frame set of the noise, the mobile terminal can identify the text frame set to obtain the title information in the two valued picture. By implementing the embodiment of the invention, the recognition accuracy of a picture with more noisy points can be enhanced.

【技术实现步骤摘要】
一种对图片进行文本识别的方法及移动终端
本专利技术涉及计算机
,具体涉及一种对图片进行文本识别的方法及移动终端。
技术介绍
随着智能手机以及学习平板的普及,学生们获取知识的方式不再局限于书本和老师,当面临一些作业难题的时候,学生们更多的会使用智能手机中的拍题APP拍照搜索相似题目,一并获得相似题目所对应的答案。但是,当学生在夜间或者光线不好的条件下拍摄时,拍出的照片中存在较多的噪点,此时,多数拍题APP就难以准确识别照片中的题目信息了。
技术实现思路
本专利技术实施例公开了一种对图片进行文本识别的方法及移动终端,能够提升对存在噪点较多的图片进行文本识别时的识别准确率。本专利技术实施例第一方面公开了一种对图片进行文本识别的方法,所述方法包括:移动终端对所述移动终端中的目标图片进行二值化处理,得到二值化图片;所述移动终端对所述二值化图片中的黑色部分进行框选,得到至少一个目标框;所述目标框中任意两个相邻像素点之间的距离小于或等于指定阈值;所述移动终端分别获取每一个所述目标框的中心点坐标,以及分别获取每一个所述目标框的面积;所述移动终端根据所述至少一个目标框确定出噪点框集和文本框集;其中,所述噪点框集中相邻目标框之间的中心点坐标距离小于预设距离,所述文本框集中相邻目标框之间的中心点坐标距离大于或等于所述预设距离;所述移动终端获取所述噪点框集的总面积以及所述文本框集的总面积;其中,所述噪点框集的总面积为所述噪点框集中包含的所有目标框的面积之和,所述文本框集的总面积为所述文本框集中包含的所有目标框的面积之和;所述移动终端判断所述文本框集的总面积是否大于所述噪点框集的总面积;如果是,所述移动终端对所述文本框集进行文本识别,得到所述二值化图片中包含的文本信息。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述方法还包括:如果所述移动终端判断出所述文本框集的总面积小于所述噪点框集的总面积,所述移动终端输出用于提示用户所述目标图片清晰度过低的提示信息;所述移动终端检测所述移动终端是否收到用户输入的重新拍摄指令,如果是,开启所述移动终端中的摄像头。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述文本信息为题目信息,所述方法还包括:所述移动终端搜索与所述题目信息相似度大于或等于预设相似度的至少一个相似题目信息;所述移动终端按照与所述题目信息相似度由高到低的顺序输出所述至少一个相似题目信息以及所述至少一个相似题目信息分别对应的答案信息;所述移动终端检测用户从所述至少一个相似题目信息中选择的目标题目信息以及所述目标题目信息对应的答案信息;所述移动终端将所述目标题目信息以及所述目标题目信息对应的答案信息存储至云端数据库。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述的移动终端对所述移动终端中的目标图片进行二值化处理,得到二值化图片,包括:移动终端对所述移动终端中的目标图片进行灰度化处理,得到灰度化图片;所述移动终端将所述灰度化图片中大于或等于预设临界灰度值的像素灰度作为灰度极大值,并且将所述灰度化图片中小于预设临界灰度值的像素灰度作为灰度极小值;所述移动终端根据所述灰度极大值和所述灰度极小值对所述灰度化图片进行二值化处理,得到二值化图片。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述的所述移动终端对所述二值化图片中的黑色部分进行框选,得到至少一个目标框,包括:所述移动终端检测所述二值化图片黑色部分中的所有相邻像素之间的距离;所述移动终端框选所述二值化图片的黑色部分,得到至少一个目标框,所述目标框中任意两个所述像素之间的距离小于或等于预设像素距离。本专利技术实施例第二方面公开了一种移动终端,所述移动终端包括:二值化处理单元,用于对所述移动终端中的目标图片进行二值化处理,得到二值化图片;框选单元,用于对所述二值化图片中的黑色部分进行框选,得到至少一个目标框;所述目标框中任意两个相邻像素点之间的距离小于或等于指定阈值;第一获取单元,用于分别获取每一个所述目标框的中心点坐标,以及分别获取每一个所述目标框的面积;确定单元,用于根据所述至少一个目标框确定出噪点框集和文本框集;其中,所述噪点框集中相邻目标框之间的中心点坐标距离小于预设距离,所述文本框集中相邻目标框之间的中心点坐标距离大于或等于所述预设距离;第二获取单元,用于获取所述噪点框集的总面积以及所述文本框集的总面积;其中,所述噪点框集的总面积为所述噪点框集中包含的所有目标框的面积之和,所述文本框集的总面积为所述文本框集中包含的所有目标框的面积之和;判断单元,用于判断所述文本框集的总面积是否大于所述噪点框集的总面积;识别单元,用于在所述判断单元判断出所述文本框集的总面积大于所述噪点框集的总面积之后,对所述文本框集进行文本识别,得到所述二值化图片中包含的文本信息。作为一种可选的实施方式,在本专利技术实施例第二方面中,所述移动终端还包括:第一输出单元,用于在所述判断单元判断出所述文本框集的总面积小于所述噪点框集的总面积之后,输出用于提示用户所述目标图片清晰度过低的提示信息;第一检测单元,用于检测所述移动终端是否收到用户输入的重新拍摄指令;开启单元,用于在所述第一检测单元检测到所述移动终端收到用户输入的重新拍摄指令之后,开启所述移动终端中的摄像头。作为一种可选的实施方式,在本专利技术实施例第二方面中,所述文本信息为题目信息,所述移动终端还包括:搜索单元,用于搜索与所述题目信息相似度大于或等于预设相似度的至少一个相似题目信息;第二输出单元,用于按照与所述题目信息相似度由高到低的顺序输出所述至少一个相似题目信息以及所述至少一个相似题目信息分别对应的答案信息;第二检测单元,用于检测用户从所述至少一个相似题目信息中选择的目标题目信息以及所述目标题目信息对应的答案信息;存储单元,用于将所述目标题目信息以及所述目标题目信息对应的答案信息存储至云端数据库。作为一种可选的实施方式,在本专利技术实施例第二方面中,所述二值化处理单元包括:灰度化处理子单元,用于对所述移动终端中的目标图片进行灰度化处理,得到灰度化图片;确定子单元,用于将所述灰度化图片中大于或等于预设临界灰度值的像素灰度作为灰度极大值,并且将所述灰度化图片中小于预设临界灰度值的像素灰度作为灰度极小值;二值化处理子单元,用于根据所述灰度极大值和所述灰度极小值对所述灰度化图片进行二值化处理,得到二值化图片。作为一种可选的实施方式,在本专利技术实施例第二方面中,所述框选单元包括:检测子单元,用于检测所述二值化图片黑色部分中的所有相邻像素之间的距离;框选子单元,用于框选所述二值化图片的黑色部分,得到至少一个目标框,所述目标框中任意两个所述像素之间的距离小于或等于预设像素距离。本专利技术实施例第三方面公开了一种移动终端,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,执行本专利技术实施例第一方面公开的对图片进行文本识别的方法。本专利技术实施例第四方面公开了一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本专利技术实施例第一方面公开的对图片进行文本识别的方法。本专利技术实施例第五方面公开了一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面公开的对图本文档来自技高网...
一种对图片进行文本识别的方法及移动终端

【技术保护点】
一种对图片进行文本识别的方法,其特征在于,所述方法包括:移动终端对所述移动终端中的目标图片进行二值化处理,得到二值化图片;所述移动终端对所述二值化图片中的黑色部分进行框选,得到至少一个目标框;所述目标框中任意两个相邻像素点之间的距离小于或等于指定阈值;所述移动终端分别获取每一个所述目标框的中心点坐标,以及分别获取每一个所述目标框的面积;所述移动终端根据所述至少一个目标框确定出噪点框集和文本框集;其中,所述噪点框集中相邻目标框之间的中心点坐标距离小于预设距离,所述文本框集中相邻目标框之间的中心点坐标距离大于或等于所述预设距离;所述移动终端获取所述噪点框集的总面积以及所述文本框集的总面积;其中,所述噪点框集的总面积为所述噪点框集中包含的所有目标框的面积之和,所述文本框集的总面积为所述文本框集中包含的所有目标框的面积之和;所述移动终端判断所述文本框集的总面积是否大于所述噪点框集的总面积;如果是,所述移动终端对所述文本框集进行文本识别,得到所述二值化图片中包含的文本信息。

【技术特征摘要】
1.一种对图片进行文本识别的方法,其特征在于,所述方法包括:移动终端对所述移动终端中的目标图片进行二值化处理,得到二值化图片;所述移动终端对所述二值化图片中的黑色部分进行框选,得到至少一个目标框;所述目标框中任意两个相邻像素点之间的距离小于或等于指定阈值;所述移动终端分别获取每一个所述目标框的中心点坐标,以及分别获取每一个所述目标框的面积;所述移动终端根据所述至少一个目标框确定出噪点框集和文本框集;其中,所述噪点框集中相邻目标框之间的中心点坐标距离小于预设距离,所述文本框集中相邻目标框之间的中心点坐标距离大于或等于所述预设距离;所述移动终端获取所述噪点框集的总面积以及所述文本框集的总面积;其中,所述噪点框集的总面积为所述噪点框集中包含的所有目标框的面积之和,所述文本框集的总面积为所述文本框集中包含的所有目标框的面积之和;所述移动终端判断所述文本框集的总面积是否大于所述噪点框集的总面积;如果是,所述移动终端对所述文本框集进行文本识别,得到所述二值化图片中包含的文本信息。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:如果所述移动终端判断出所述文本框集的总面积小于所述噪点框集的总面积,所述移动终端输出用于提示用户所述目标图片清晰度过低的提示信息;所述移动终端检测所述移动终端是否收到用户输入的重新拍摄指令,如果是,开启所述移动终端中的摄像头。3.根据权利要求2所述的方法,其特征在于,所述文本信息为题目信息,所述方法还包括:所述移动终端搜索与所述题目信息相似度大于或等于预设相似度的至少一个相似题目信息;所述移动终端按照与所述题目信息相似度由高到低的顺序输出所述至少一个相似题目信息以及所述至少一个相似题目信息分别对应的答案信息;所述移动终端检测用户从所述至少一个相似题目信息中选择的目标题目信息以及所述目标题目信息对应的答案信息;所述移动终端将所述目标题目信息以及所述目标题目信息对应的答案信息存储至云端数据库。4.根据权利要求3所述的方法,其特征在于,所述的移动终端对所述移动终端中的目标图片进行二值化处理,得到二值化图片,包括:移动终端对所述移动终端中的目标图片进行灰度化处理,得到灰度化图片;所述移动终端将所述灰度化图片中大于或等于预设临界灰度值的像素灰度作为灰度极大值,并且将所述灰度化图片中小于预设临界灰度值的像素灰度作为灰度极小值;所述移动终端根据所述灰度极大值和所述灰度极小值对所述灰度化图片进行二值化处理,得到二值化图片。5.根据权利要求1~4任一项所述的方法,其特征在于,所述的所述移动终端对所述二值化图片中的黑色部分进行框选,得到至少一个目标框,包括:所述移动终端检测所述二值化图片黑色部分中的所有相邻像素之间的距离;所述移动终端框选所述二值化图片的黑色部分,得到至少一个目标框,所述目标框中任意两个所述像素之间的距离小于或等于预设像素距离。6.一种移动终端,其特征在于,所述移动终端包括:二值化处理单元,...

【专利技术属性】
技术研发人员:龙安忠
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1