基于图像分割的燃气表字轮坐标提取方法技术

技术编号:30412967 阅读:35 留言:0更新日期:2021-10-20 11:50
本发明专利技术涉及基于图像分割的燃气表字轮坐标提取方法,包括步骤:图像采集终端采集燃气表的字轮窗图像,利用Faster

【技术实现步骤摘要】
基于图像分割的燃气表字轮坐标提取方法


[0001]本专利技术涉及字轮坐标识别
,特别涉及一种基于图像分割的燃气表字轮坐标提取方法。

技术介绍

[0002]为了获取燃气表上的字符,摄像采集终端根据字轮坐标,将采集的图片按照坐标从字轮窗中截取出字符图像,然后再将截取出的字符图像通过无线传输的方式上传到识别系统进行识别,从而获得燃气表当前的字符。通过仅上传字符图像的方式,能够大大降低通讯的数据量,节约通讯传输时间、提高通讯可靠性、降低燃气表的功耗。
[0003]但是目前提取的字轮坐标是通过人为到现场获取到字轮图像后,利用切图工具把每个字符移动到指定的区域,然后将字符的坐标下发到摄像采集终端中,这样会存在以下问题:1,需要人为到现场调解,才能确定摄像采集终端所要截取的坐标对应于燃气表字符,安装调试麻烦;2,若因外界原因,比如刮风、人为等原因导致摄像采集终端或燃气表发生位移,那么摄像采集终端根据坐标截取的字符则不再准确,甚至会有很大的误差,此时则需要重新到现场进行调节,因此维护会非常的麻烦。

技术实现思路

[0004]本专利技术的目的在于准确的根据字轮坐标参数分割出字轮窗图像中的字符,提供一种基于图像分割的燃气表字轮坐标提取方法。
[0005]为了实现上述专利技术目的,本专利技术实施例提供了以下技术方案:基于图像分割的燃气表字轮坐标提取方法,包括以下步骤:步骤S1:图像采集终端采集燃气表的字轮窗图像,利用Faster

Rcnn模型对采集的字轮窗图像进行学习,生成字轮窗图像的特征参数文件;步骤S2:将所述图像采集终端采集的燃气表的字轮窗图像压缩后上传到图像识别平台,图像识别平台将压缩后的字轮窗图像还原后,将字轮窗图像的地址写入Redis监控队列中;步骤S3:基于Faster

Rcnn模型学习生成的特征参数文件对所述Redis监控队列中的字轮窗图像的坐标参数进行提取;步骤S4:图像识别平台将生成的该字轮窗图像对应的坐标参数进行线性拟合后发送至图像采集终端,图像采集终端根据线性拟合后的坐标参数对采集的该字轮窗图像进行分割,获得字轮窗图像中的字符,并将获取的字符发送到图像识别平台进行识别处理。
[0006]在上述方案中,只需要首次使用或设备位置发生移动时,将采集的字轮窗图像压缩后发送至图像识别终端,以计算获取坐标参数,此后图像采集终端都根据该坐标参数对字轮窗图像进行字符分割,无需人员再现场调试设备的位置,也能够自动更新计算坐标参
数,提高字符提取的准确性。
[0007]所述步骤S1具体包括以下步骤:步骤S1

1:采集燃气表的字轮窗图像,使用labelImg图像标注对字轮窗图像中目标体的位置进行标注,标注后形成xml格式的数据文件;所述数据文件中记录了目标体的个数,以及每个目标体在字轮窗图像中的位置;步骤S1

2:将采集的字轮窗图像和标注后形成的xml格式的数据文件输入Faster

Rcnn模型中,进行特征提取的训练,以提取字轮窗图像的特征,形成特征参数文件。
[0008]所述Faster

Rcnn模型包括卷积层、候选区推荐器、池化层;所述卷积层采用VGG

16模型提取字轮窗图像的特征,先将大小为P
×
Q的原始字轮窗图像缩放剪裁为M
×
N的大小,经过13个卷积层后形成大小为(M/16)
×
(N/16)的特征向量;每个所述卷积层的卷积核为3
×
3的规模;所述候选区推荐器采用RPN算法对卷积层输出的特征向量进行计算后,将特征向量分为两路,一路用于判断字轮窗图像为前景还是背景,另一路用于重构为一维特征向量,然后再使用逻辑回归算法来判断字轮窗图像为前景还是背景;两路计算结束后挑选出前景候选框,通过RPN算法计算得到候选框的位置;所述池化层根据候选框的位置获取特征子图,经过4个池化层后形成字轮窗图像的特征,生成特征参数文件;每个所述池化层的卷积核为2
×
2的规模。
[0009]所述步骤S2具体包括以下步骤:步骤S2

1:所述图像采集终端将采集的字轮窗图像压缩后,通过Spring boot服务器提供的接口上传到图像识别平台,在传输压缩后的字轮窗图像时,以二进制流的方式上传;步骤S2

2:所述图像识别平台对上传的二进制流进行解析,获得灰度矩阵,依据灰度矩阵还原压缩后的字轮窗图像;步骤S2

3:图像识别平台保存灰度矩阵为字轮窗图像,并将该字轮窗图像的地址写入Redis监控队列中。
[0010]所述步骤S3具体包括以下步骤:步骤S3

1:图像识别平台调用步骤S1中Faster

Rcnn模型学习生成的特征参数文件,使用该特征参数文件监控Redis监控队列中地址;步骤S3

2:使用特征参数文件对Redis监控队列中字轮窗图像的坐标参数进行提取。
[0011]在上述方案中,由于压缩后的字轮窗图像分辨率很低,图像模糊,可以减少图像数据传输量,但是该压缩后的字轮窗图像即使被图像识别平台还原后,也只能用来确定坐标,不能直接进行字符识别,所以图像识别平台会将坐标发送回图像采集终端,让图像采集终端来分割字符,最后将字符上传至图像识别平台。
[0012]所述步骤S4具体包括以下步骤:生成的该字轮窗图像对应的坐标参数包括{(x1,y1),(x2,y2),...(xn,yn)},其中n为字轮窗图像中字符的个数,x为字符的横坐标,y为字符的纵坐标;且有函数y=f(x;b),通过坐标参数x、y寻求参数b的最佳估计值,从而获得最佳的理论曲线y=f(x;b),从中获得线性拟合后的坐标参数。
[0013]与现有技术相比,本专利技术的有益效果:本专利技术根据图像采集终端上传的压缩图像,图像识别平台自动生成字符的坐标参数,图像采集终端根据图像识别平台下发的字符坐标参数上传切割后的字符到图像识别平台中,大大降低通讯的数据量,节约通讯传输时间、提高通讯可靠性、降低采集终端的功耗。当发现图像采集终端或燃气表的位置偏移时,可远程下发命令重新获取字符坐标参数,降低人为到现场维护的工作量。
附图说明
[0014]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍, 应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0015]图1为本专利技术方法流程图;图2为本专利技术Faster

Rcnn模型结构示意图。
具体实施方式
[0016]下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于图像分割的燃气表字轮坐标提取方法,其特征在于:包括以下步骤:步骤S1:图像采集终端采集燃气表的字轮窗图像,利用Faster

Rcnn模型对采集的字轮窗图像进行学习,生成字轮窗图像的特征参数文件;步骤S2:将所述图像采集终端采集的燃气表的字轮窗图像压缩后上传到图像识别平台,图像识别平台将压缩后的字轮窗图像还原后,将字轮窗图像的地址写入Redis监控队列中;步骤S3:基于Faster

Rcnn模型学习生成的特征参数文件对所述Redis监控队列中的字轮窗图像的坐标参数进行提取;步骤S4:图像识别平台将生成的该字轮窗图像对应的坐标参数进行线性拟合后发送至图像采集终端,图像采集终端根据线性拟合后的坐标参数对采集的该字轮窗图像进行分割,获得字轮窗图像中的字符,并将获取的字符发送到图像识别平台进行识别处理。2.根据权利要求1所述的基于图像分割的燃气表字轮坐标提取方法,其特征在于:所述步骤S1具体包括以下步骤:步骤S1

1:采集燃气表的字轮窗图像,使用labelImg图像标注对字轮窗图像中目标体的位置进行标注,标注后形成xml格式的数据文件;所述数据文件中记录了目标体的个数,以及每个目标体在字轮窗图像中的位置;步骤S1

2:将采集的字轮窗图像和标注后形成的xml格式的数据文件输入Faster

Rcnn模型中,进行特征提取的训练,以提取字轮窗图像的特征,形成特征参数文件。3.根据权利要求2所述的基于图像分割的燃气表字轮坐标提取方法,其特征在于:所述Faster

Rcnn模型包括卷积层、候选区推荐器、池化层;所述卷积层采用VGG

16模型提取字轮窗图像的特征,先将大小为P
×
Q的原始字轮窗图像缩放剪裁为M
×
N的大小,经过13个卷积层后形成大小为(M/16)
×
(N/16)的特征向量;每个所述卷积层的卷积核为3
×
3的规模;...

【专利技术属性】
技术研发人员:贾忠友朱炼吴忝睿
申请(专利权)人:成都千嘉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1