纸币冠字号图像区域的定位方法,包括以下步骤:获取水平放置的单张纸币图像;获取当前纸币图像的冠字号出现的区域;分别在每个区域内选择两行,获取像素值小于上限阈值F的像素数量占像素总数量的比例;分别对每个区域的每一行的像素进行[-1,0,1]的Sobel梯度计算,获取梯度计算值大于下限阈值G的像素的数量占像素总量的比例;对四个区域的采样行分别计算V1+V2的值,寻找V1+V2的最大值,将该最大值对应的区域作为冠字码区域;将冠字码区域图像放大,并将放大后的图像做倾斜和纵向拉伸校正,剔除冠字码区域图像的空白区域,识别冠字码区域图像的字符。本发明专利技术具有能够准确地对纸币冠字号区域定位,可靠性高的优点。
【技术实现步骤摘要】
本专利技术涉及一种图像定位方法。
技术介绍
纸币图像冠字号区域定位方法是冠字号识别的常见步骤,目前公布的方法中主要包括两类。第一类是投影定位法,将二值化后的图像进行水平、垂直投影,统计水平与垂直方向上各行与各列的熙像素点的数目,以此确定号码区域。这种方法受二值化后噪声点的影响,容易定位偏上或偏下。第二类是一种基于矩形框搜索的定位方法。由于拍摄样本图像时焦距和物距是一定的,所以纯号码区域的宽度w和高度H也是固定的。建立一个大小是wXH像素的矩形,逐行逐列统计图像中以当前像素点为左上顶点的矩形区域内黑色像素点的总数。记录下黑 点总数最大的矩形区域的坐标,该坐标既为纯号码区域的坐标。此方法在处理脏币、旧币图像时容易失效。
技术实现思路
为克服现有技术容易出现定位失效的缺点,本专利技术提供了一种能够准确地对纸币冠字号区域定位,可靠性高的。,包括以下步骤 1)、获取水平放置的单张纸币图像,纸币图像与纸币的比例正确; 2)、获取当前纸币图像的第一区域、第二区域、第三区域和第四区域的区域图像,第一区域对应纸币正面正置时冠字号的位置区域,第二区域对应纸币正面倒置时冠字号的位置区域,第三区域对应纸币反面正置时冠字号的位置区域,第四区域对应纸币反面倒置时冠字号的位置区域; 3)、分别在每个区域内至少选择两行数据作为采样行,分别获取每个采样行的像素值,像素值指的是组成行数据的像素点的亮度值,计算像素值小于上限阈值F的像素点的数量,将像素值小于上限阈值F的像素点数量占像素点总数量的比例记为V1 ; 4)、分别对每个区域的每一行的像素进行的Sobel梯度计算,获取梯度计算值大于下限阈值G的像素点的数量占像素点总数量的比例,该比例记为V2;经过Sobel计算后,每个像素位置会得到一个梯度计算值,梯度计算值越大,此对应的像素位置处于图像内容边缘的可能性就越大; 5)、对四个区域的所有采样行,对每个采样行分别计算该采样行VJV2的值,寻找'+V2的最大值,将该最大值所在的区域作为冠字码区域; 6)、将冠字码区域图像放大,并将放大后的图像做倾斜和纵向拉伸校正,剔除冠字码区域图像的空白区域,保存图像,识别冠字码区域图像的字符。进一步,步骤3)中,每个区域选择两行数据作为采样行。两行采样行通常已经足够给出正确结果,而且计算量小,降低系统的计算负担。进一步,步骤6)中,将候选区域图像放大2倍。进一步,步骤6)中,通过OCR字符识别程序识别冠字码区域图像的字符串数值。本专利技术的技术构思是因为系统无法区分放置的纸币是正面放置还是反面放置,是倒置还是正置,因此抓取纸币图像的四个区域,四个区域分别对应纸币的四种放置方式时冠字码区域对应的位置。分别计算四个区域的像素值,以确定冠字码所在的位置,最后经过OCR字符识别程序将冠字码的字符串识别出来。本专利技术能够准确的识别冠字码所在区域,可靠性高,且能够保证在IOOms内完成单张纸币的冠字码识别,适用于大规模产业化应用。附图说明图I是本专利技术的流程图。 具体实施例方式参照附图,进一步说明本专利技术 ,包括以下步骤 1)、获取水平放置的单张纸币图像,纸币图像与纸币的比例正确; 2)、获取当前纸币图像的第一区域、第二区域、第三区域和第四区域的区域图像,第一区域对应纸币正面正置时冠字号的位置区域,第二区域对应纸币正面倒置时冠字号的位置区域,第三区域对应纸币反面正置时冠字号的位置区域,第四区域对应纸币反面倒置时冠字号的位置区域; 3)、分别在每个区域内至少选择两行数据作为采样行,分别获取每个采样行的像素值,像素值指的是组成行数据的像素点的亮度值,计算像素值小于上限阈值F的像素点的数量,将像素值小于上限阈值F的像素点数量占像素点总数量的比例记为V1 ; 4)、分别对每个区域的每一行的像素进行的Sobel梯度计算,获取梯度计算值大于下限阈值G的像素点的数量占像素点总数量的比例,该比例记为V2;经过Sobel计算后,每个像素位置会得到一个梯度计算值,梯度计算值越大,此对应的像素位置处于图像内容边缘的可能性就越大; 5)、对四个区域的所有采样行,对每个采样行分别计算该采样行VJV2的值,寻找'+V2的最大值,将该最大值所在的区域作为冠字码区域; 6)、将冠字码区域图像放大,并将放大后的图像做倾斜和纵向拉伸校正,剔除冠字码区域图像的空白区域,保存图像,识别冠字码区域图像的字符。步骤3)中,每个区域选择两行数据作为采样行。两行采样行通常已经足够给出正确结果,而且计算量小,降低系统的计算负担。步骤6)中,将候选区域图像放大2倍。且通过OCR字符识别程序识别冠字码区域图像的字符串数值。本专利技术的技术构思是因为系统无法区分放置的纸币是正面放置还是反面放置,是倒置还是正置,因此抓取纸币图像的四个区域,四个区域分别对应纸币的四种放置方式时冠字码区域对应的位置。分别计算四个区域的像素值,以确定冠字码所在的位置,最后经过OCR字符识别程序将冠字码的字符串识别出来。本专利技术能够准确的识别冠字码所在区域,可靠性高,且能够保证在IOOms内完成单张纸币的冠字码识别,适用于大规模产业化应用。 本说明书实施例所述的内容仅仅是对专利技术构思的实现形式的列举,本专利技术的保护范围不应当被视为仅限于实施例所陈述的具体形式,本专利技术的保护范围也及于本领域技术人员根据本专利技术构思所能够想到的等同技术手段。权利要求1.,包括以下步骤 1)、获取水平放置的单张纸币图像,纸币图像与纸币的比例正确; 2)、获取当前纸币图像的第一区域、第二 区域、第三区域和第四区域的区域图像,第一区域对应纸币正面正置时冠字号的位置区域,第二区域对应纸币正面倒置时冠字号的位置区域,第三区域对应纸币反面正置时冠字号的位置区域,第四区域对应纸币反面倒置时冠字号的位置区域; 3)、分别在每个区域内至少选择两行数据作为采样行,分别获取每个采样行的像素值,像素值指的是组成行数据的像素点的亮度值,计算像素值小于上限阈值F的像素点的数量,将像素值小于上限阈值F的像素点数量占像素点总数量的比例记为V1 ; 4)、分别对每个区域的每一行的像素进行的Sobel梯度计算,获取梯度计算值大于下限阈值G的像素点的数量占像素点总数量的比例,该比例记为V2;经过Sobel计算后,每个像素位置会得到一个梯度计算值,梯度计算值越大,此对应的像素位置处于图像内容边缘的可能性就越大; 5)、对四个区域的所有采样行,对每个采样行分别计算该采样行'+V2的值,寻找'+V2的最大值,将该最大值所在的区域作为冠字码区域; 6)、将冠字码区域图像放大,并将放大后的图像做倾斜和纵向拉伸校正,剔除冠字码区域图像的空白区域,保存图像,识别冠字码区域图像的字符。2.如权利要求I所述的,其特征在于步骤6中,将候选区域图像放大2倍。3.如权利要求2所述的,其特征在于通过OCR字符识别程序识别冠字码区域图像的字符串数值。全文摘要,包括以下步骤获取水平放置的单张纸币图像;获取当前纸币图像的冠字号出现的区域;分别在每个区域内选择两行,获取像素值小于上限阈值F的像素数量占像素总数量的比例;分别对每个区域的每一行的像素进行的Sobel梯度计算,获取梯度计算值大于下限阈值G的像素的数量占像素总量的比例;对四个区域的采样行分别计算V1+V2的值本文档来自技高网...
【技术保护点】
纸币冠字号图像区域的定位方法,包括以下步骤:1)、获取水平放置的单张纸币图像,纸币图像与纸币的比例正确;2)、获取当前纸币图像的第一区域、第二区域、第三区域和第四区域的区域图像,第一区域对应纸币正面正置时冠字号的位置区域,第二区域对应纸币正面倒置时冠字号的位置区域,第三区域对应纸币反面正置时冠字号的位置区域,第四区域对应纸币反面倒置时冠字号的位置区域;3)、分别在每个区域内至少选择两行数据作为采样行,分别获取每个采样行的像素值,像素值指的是组成行数据的像素点的亮度值,计算像素值小于上限阈值F的像素点的数量,将像素值小于上限阈值F的像素点数量占像素点总数量的比例记为V1;4)、分别对每个区域的每一行的像素进行[?1,0,1]的Sobel梯度计算,获取梯度计算值大于下限阈值G的像素点的数量占像素点总数量的比例,该比例记为V2;经过Sobel计算后,每个像素位置会得到一个梯度计算值,梯度计算值越大,此对应的像素位置处于图像内容边缘的可能性就越大;5)、对四个区域的所有采样行,对每个采样行分别计算该采样行V1+V2的值,寻找V1+V2的最大值,将该最大值所在的区域作为冠字码区域;6)、将冠字码区域图像放大,并将放大后的图像做倾斜和纵向拉伸校正,剔除冠字码区域图像的空白区域,保存图像,识别冠字码区域图像的字符。...
【技术特征摘要】
【专利技术属性】
技术研发人员:王成洲,高峰,
申请(专利权)人:杭州九聚科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。