一种基于深度学习的购物小票图片识别方法技术

技术编号：26033025 阅读：45 留言：0更新日期：2020-10-23 21:10

本发明专利技术公开了一种基于深度学习的购物小票图片识别方法，涉及人工智能识别技术领域。本发明专利技术方法步骤包括：S1、获取购物小票的图像；S2、采用目标检测模型检测购物小票图像，判断购物小票区域是否存在；S3、判断文本实例区域是否存在；S4、识别一个或多个文本实例区域图像，获取文本识别结果；S5、对一个或多个文本实例区域按行、列等信息进行排序划分；S6、对关键信息进行后续的规则审判；S7、对整个过程的动作结果进行统计分析。本发明专利技术主要应用于购物小票图片的识别审核，有利于简化处理过程，方便使用，且满足复杂场景下的购物小票等的图片文字识别的需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的购物小票图片识别方法
本专利技术属于人工智能识别
，特别是涉及一种基于深度学习的购物小票图片识别方法。
技术介绍
现有的应用于购物小票识别方法主要是通过传统OCR技术来实现的，具体包括下列步骤：(1)对图片进行二值化,统计色值数量,将色值数量最多的颜色做为背景色；(2)对图片按行切分；(3)对切分后的每一行沿空白像素纵向切分,得到一个或多个字符区域；(4)将每个字符区域生成一张字符图片,将每个字符图片缩放为一个特定尺寸的图片；(5)提取每个字符图片的字符图片特征；(6)依据字符图片特征进行字符查询,获得相应的字符,字符查询以特征数据库为数据基础,所述特征数据库为体现字符图片特征与相应字符映射关系的数据库；(7)将查询获得的字符顺序排列,形成初步的文字识别结果。由于现有技术的实现主要是通过传统OCR技术，这种基于数字图像处理和传统机器学习等方法，需要对图像进行去噪，二值化等处理和特征提取。处理过程复杂繁琐，其中一些处理过程还需要对不同场景调整阈值。对图片要求较高。常用的二值化处理有利于增强简单场景的文本信息，但对于复杂背景二值化的收效甚微。传统OCR方法上采用HoG对图像进行特征提取，然而HoG对于图像模糊、扭曲等问题鲁棒性很差，对于复杂场景泛化能力不佳。因此对于上述问题，提供一种基于深度学习的购物小票图片识别方法具有重要意义。
技术实现思路
本专利技术目的是提出一种基于深度学习的购物小票识别方法，有利于简化处理过程，方便使用，且满足复杂场景下的购物小票等的图片文字识...

【技术保护点】
1.一种基于深度学习的购物小票图片识别方法，其特征在于，包括如下步骤：/nS1、获取待检测的购物小票的图像；/nS2、采用基于深度学习的目标检测模型检测购物小票图像，判断购物小票区域是否存在，若存在则记录此条标志为1，提取购物小票区域并进入下一步骤；若不存在则记录此条标志为0，并保存相关图片，进入统计分析流程S7；/nS3、获取购物小票区域图像，采用基于深度学习的文本检测模型检测购物小票区域图像，判断文本实例区域是否存在，若存在则记录此条标志为1，提取一个或多个文本实例区域，以及文本实例的目标检测框的信息并进入下一步骤；若不存在则记录此条标志为0，并保存相关图片，进入统计分析流程S7；/nS4、采用基于深度学习的文本识别模型依次识别一个或多个文本实例区域图像，获取文本识别结果；具体为：获取文本实例区域图像，然后识别文本实例区域图像，根据识别文本实例区域图像处理文本识别结果，判断文本识别结果是否符合审核规则，若符合则记录此条标志为1并进入下一步骤；若不符合，则记录该条标志为0，并保存相关图片，进入统计分析流程S7；/nS5、根据文本实例区域目标检测框的的中心点坐标，对一个或多个文本实例区...

【技术特征摘要】
1.一种基于深度学习的购物小票图片识别方法，其特征在于，包括如下步骤：
S1、获取待检测的购物小票的图像；
S2、采用基于深度学习的目标检测模型检测购物小票图像，判断购物小票区域是否存在，若存在则记录此条标志为1，提取购物小票区域并进入下一步骤；若不存在则记录此条标志为0，并保存相关图片，进入统计分析流程S7；
S3、获取购物小票区域图像，采用基于深度学习的文本检测模型检测购物小票区域图像，判断文本实例区域是否存在，若存在则记录此条标志为1，提取一个或多个文本实例区域，以及文本实例的目标检测框的信息并进入下一步骤；若不存在则记录此条标志为0，并保存相关图片，进入统计分析流程S7；
S4、采用基于深度学习的文本识别模型依次识别一个或多个文本实例区域图像，获取文本识别结果；具体为：获取文本实例区域图像，然后识别文本实例区域图像，根据识别文本实例区域图像处理文本识别结果，判断文本识别结果是否符合审核规则，若符合则记录此条标志为1并进入下一步骤；若不符合，则记录该条标志为0，并保存相关图片，进入统计分析流程S7；
S5、根据文本实例区域目标检测框的的中心点坐标，对一个或多个文本实例区域按行、列等信息进行排序划分；
S6、遍历按行、列划分后的文本识别结果，根据关键字进行文本匹配，提取所需的关键信息，并对关键信息进行后续的规则审判，若满足相关规则，则记录此条标志为1；若不满足则记录此条标志为0，进入统计...

【专利技术属性】
技术研发人员：谷维鑫，
申请(专利权)人：上海品览数据科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人