一种对图片进行文本识别的方法及移动终端技术

技术编号：17879546 阅读：28 留言：0更新日期：2018-05-06 01:11

一种对图片进行文本识别的方法及移动终端，包括：移动终端可以将移动终端中的图片进行二值化处理；移动终端还可以根据相邻像素之间的距离与指定阈值之间的大小关系可以将二值化图片中的黑色部分分别框选出来，得到至少一个目标框，该目标框中任意两个相邻像素点之间的距离小于或等于指定阈值；移动终端还能计算每个目标框的面积和中心点坐标，并根据相邻中心点坐标的距离与预设距离的大小关系将目标框分为噪点框集和文本框集两类集合；当文本框集的总面积大于噪点框集的总面积时，移动终端则可以对文本框集进行文本识别，以获取二值化图片中的题目信息。实施本发明专利技术实施例，能够提升对存在噪点较多的图片进行文本识别时的识别准确率。

A method for text recognition of pictures and mobile terminals

A method of text recognition for a picture and a mobile terminal, including: the mobile terminal can two value the picture in the mobile terminal; the mobile terminal can also frame the black part in the two valued picture according to the size relation between the distance between adjacent pixels and the specified threshold. At least one target box, the distance between any two adjacent pixels in the target box is less than or equal to the specified threshold. The mobile terminal can also calculate the area and center point coordinates of each target frame, and divide the target frame into the noise frame set and the text frame set two according to the relation between the distance of the adjacent central point coordinates and the preset distance. When the total area of the text frame set is larger than the total area of the frame set of the noise, the mobile terminal can identify the text frame set to obtain the title information in the two valued picture. By implementing the embodiment of the invention, the recognition accuracy of a picture with more noisy points can be enhanced.

全部详细技术资料下载

【技术实现步骤摘要】
一种对图片进行文本识别的方法及移动终端
本专利技术涉及计算机
，具体涉及一种对图片进行文本识别的方法及移动终端。
技术介绍
随着智能手机以及学习平板的普及，学生们获取知识的方式不再局限于书本和老师，当面临一些作业难题的时候，学生们更多的会使用智能手机中的拍题APP拍照搜索相似题目，一并获得相似题目所对应的答案。但是，当学生在夜间或者光线不好的条件下拍摄时，拍出的照片中存在较多的噪点，此时，多数拍题APP就难以准确识别照片中的题目信息了。
技术实现思路
本专利技术实施例公开了一种对图片进行文本识别的方法及移动终端，能够提升对存在噪点较多的图片进行文本识别时的识别准确率。本专利技术实施例第一方面公开了一种对图片进行文本识别的方法，所述方法包括：移动终端对所述移动终端中的目标图片进行二值化处理，得到二值化图片；所述移动终端对所述二值化图片中的黑色部分进行框选，得到至少一个目标框；所述目标框中任意两个相邻像素点之间的距离小于或等于指定阈值；所述移动终端分别获取每一个所述目标框的中心点坐标，以及分别获取每一个所述目标框的面积；所述移动终端根据所述至少一个目标框确定出噪点框集和文本框集；其中，所述噪点框集中相邻目标框之间的中心点坐标距离小于预设距离，所述文本框集中相邻目标框之间的中心点坐标距离大于或等于所述预设距离；所述移动终端获取所述噪点框集的总面积以及所述文本框集的总面积；其中，所述噪点框集的总面积为所述噪点框集中包含的所有目标框的面积之和，所述文本框集的总面积为所述文本框集中包含的所有目标框的面积之和；所述移动终端判断所述文本框集的总面积是否大于所述噪点框集的...
一种对图片进行文本识别的方法及移动终端

【技术保护点】
一种对图片进行文本识别的方法，其特征在于，所述方法包括：移动终端对所述移动终端中的目标图片进行二值化处理，得到二值化图片；所述移动终端对所述二值化图片中的黑色部分进行框选，得到至少一个目标框；所述目标框中任意两个相邻像素点之间的距离小于或等于指定阈值；所述移动终端分别获取每一个所述目标框的中心点坐标，以及分别获取每一个所述目标框的面积；所述移动终端根据所述至少一个目标框确定出噪点框集和文本框集；其中，所述噪点框集中相邻目标框之间的中心点坐标距离小于预设距离，所述文本框集中相邻目标框之间的中心点坐标距离大于或等于所述预设距离；所述移动终端获取所述噪点框集的总面积以及所述文本框集的总面积；其中，所述噪点框集的总面积为所述噪点框集中包含的所有目标框的面积之和，所述文本框集的总面积为所述文本框集中包含的所有目标框的面积之和；所述移动终端判断所述文本框集的总面积是否大于所述噪点框集的总面积；如果是，所述移动终端对所述文本框集进行文本识别，得到所述二值化图片中包含的文本信息。

【技术特征摘要】
1.一种对图片进行文本识别的方法，其特征在于，所述方法包括：移动终端对所述移动终端中的目标图片进行二值化处理，得到二值化图片；所述移动终端对所述二值化图片中的黑色部分进行框选，得到至少一个目标框；所述目标框中任意两个相邻像素点之间的距离小于或等于指定阈值；所述移动终端分别获取每一个所述目标框的中心点坐标，以及分别获取每一个所述目标框的面积；所述移动终端根据所述至少一个目标框确定出噪点框集和文本框集；其中，所述噪点框集中相邻目标框之间的中心点坐标距离小于预设距离，所述文本框集中相邻目标框之间的中心点坐标距离大于或等于所述预设距离；所述移动终端获取所述噪点框集的总面积以及所述文本框集的总面积；其中，所述噪点框集的总面积为所述噪点框集中包含的所有目标框的面积之和，所述文本框集的总面积为所述文本框集中包含的所有目标框的面积之和；所述移动终端判断所述文本框集的总面积是否大于所述噪点框集的总面积；如果是，所述移动终端对所述文本框集进行文本识别，得到所述二值化图片中包含的文本信息。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：如果所述移动终端判断出所述文本框集的总面积小于所述噪点框集的总面积，所述移动终端输出用于提示用户所述目标图片清晰度过低的提示信息；所述移动终端检测所述移动终端是否收到用户输入的重新拍摄指令，如果是，开启所述移动终端中的摄像头。3.根据权利要求2所述的方法，其特征在于，所述文本信息为题目信息，所述方法还包括：所述移动终端搜索与所述题目信息相似度大于或等于预设相似度的至少一个相似题目信息；所述移动终端按照与所述题目信息相似度由高到低的顺序输出所述至少一个相似题目信息以及所述至少一个相似题目信息分别对应的答案信息；所述移动终端检测用户从所述至少一个相似题目信息中选择的目标题目信息以及所述目标题目信息对应的答案信息；所述移动终端将所述目标题目信息以及所述目标题目信息对应的答案信息存储至云端数据库。4.根据权利要求3所述的方法，其特征在于，所述的移动终端对所述移动终端中的目标图片进行二值化处理，得到二值化图片，包括：移动终端对所述移动终端中的目标图片进行灰度化处理，得到灰度化图片；所述移动终端将所述灰度化图片中大于或等于预设临界灰度值的像素灰度作为灰度极大值，并且将所述灰度化图片中小于预设临界灰度值的像素灰度作为灰度极小值；所述移动终端根据所述灰度极大值和所述灰度极小值对所述灰度化图片进行二值化处理，得到二值化图片。5.根据权利要求1～4任一项所述的方法，其特征在于，所述的所述移动终端对所述二值化图片中的黑色部分进行框选，得到至少一个目标框，包括：所述移动终端检测所述二值化图片黑色部分中的所有相邻像素之间的距离；所述移动终端框选所述二值化图片的黑色部分，得到至少一个目标框，所述目标框中任意两个所述像素之间的距离小于或等于预设像素距离。6.一种移动终端，其特征在于，所述移动终端包括：二值化处理单元，...

【专利技术属性】
技术研发人员：龙安忠，
申请(专利权)人：广东小天才科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人