本发明专利技术公开了一种基于深度学习的字轮式表盘读数识别方法,表盘读数识别技术领域,识别方法包括步骤:采集包含表盘读数区域的图像;通过检测模型识别表盘的字符区域位置;通过识别模型对字符区域的字符进行识别;输出识别模型识别的字符,完成识别,所述检测模型包括:特征识别模块,所述特征提取模块对采集包含表盘读数区域的图像进行预处理,提取特征图;特征交互模块,所述特征交互模块将多个特征图进行特征交互;融合模块,所述融合模块将不同特征图进行采样融合,特征融合中使用二阶注意力来完成特征图权重的分配;预测模块,所述预测模块整合融合模块信息,对字符区域位置进行识别,本发明专利技术中识别方法可以更准确的对字符进行识别
【技术实现步骤摘要】
一种基于深度学习的字轮式表盘读数识别方法
[0001]本专利技术涉及表盘读数识别
,尤其涉及到一种基于深度学习的字轮式表盘读数识别方法
。
技术介绍
[0002]现有的水表抄表技术主要为人工抄表和物联网抄表,物联网抄表由于成本和维护等原因,并未大面积普及
。
现今,人工抄表依然是主要的抄表手段
。
随着图像处理和深度学习技术的成熟,水表字符识别成为了一种新的抄表手段,但是,这种依靠从图像中获得读数的方式并不能很好的适用于复杂的现实场景,例如,拍摄环境和拍摄角度造成的图像模糊
、
字符遮挡和字符粘连等情况,水表字符识别的准确率差
。
技术实现思路
[0003]本专利技术的目的在于克服现有技术的不足,提供了一种基于深度学习的字轮式表盘读数识别方法及方法,相比于现有技术,本专利技术中的基于深度学习的字轮式表盘读数识别方法可以更准确的对字符进行识别
。
[0004]本专利技术是通过以下技术方案实现的:本专利技术公开一种基于深度学习的字轮式表盘读数识别方法,识别方法包括步骤:
[0005]采集包含表盘读数区域的图像;
[0006]通过检测模型识别表盘的字符区域位置;
[0007]通过识别模型对字符区域的字符进行识别;
[0008]输出识别模型识别的字符,完成识别
。
[0009]优选地,所述检测模型包括:
[0010]特征识别模块,所述特征提取模块对采集包含表盘读数区域的图像进行预处理,提取特征图;
[0011]特征交互模块,所述特征交互模块将多个特征图进行特征交互;
[0012]融合模块,所述融合模块将不同特征图进行采样融合,特征融合中使用二阶注意力来完成特征图权重的分配;
[0013]预测模块,所述预测模块整合融合模块信息,对字符区域位置进行识别
。
[0014]优选地,所述识别模型包括:
[0015]特征提取模块,所述特征提取模块以识别的字符区域作为输出,输出字符区域的特征;
[0016]特征增强模块,对所述输出字符区域的特征进行处理,使用细粒度增强的方式来增加网络对字符局部特征的表达能力,获得第二特征图;
[0017]特征拼接模块,将获得的第二特征图两两进行哈达姆计算,获得的结果进行拼接,将拼接后的第二特征图进行高度维度为1的池化操作,然后将池化后的特征序列送入带有转录层的预测头进行预测,输出字符区域的字符信息
。
[0018]优选地,所述特征识别模块预处理的步骤包括:
[0019]输入的包含表盘读数区域的图像调整为第一尺寸;
[0020]使用卷积神经网络提取第一尺寸图像的特征
。
[0021]优选地,特征提取模块基于
EfficientNetv2
架构形成
。
[0022]本专利技术公开了一种基于深度学习的字轮式表盘读数识别方法及方法,与现有技术相比:
[0023]本专利技术的识别方法采用了基于深度学习的方法,能够自动地学习表盘上的数字和字符特征,具有较高的识别精度和鲁棒性
。
同时,采用了检测模型和识别模型相结合的方式,能够准确地定位字符区域和识别字符信息,具有较高的实用性和应用价值
。
附图说明
[0024]图1为本专利技术实施例中基于深度学习的字轮式表盘读数识别方法的结构示意图;
[0025]图2为一实施例中喷雾系统的结构示意图;
[0026]图3为一实施例中第一盘体的结构示意图;
[0027]图4为一实施例中喷雾系统的喷雾状态示意图;
[0028]图5为另一实施例中喷雾系统的喷雾状态示意图
。
具体实施方式
[0029]下面对本专利技术的实施例作详细说明,本实施例在以本专利技术技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例
。
[0030]水表读数识别方法对复杂场景下水表字符识别率不高的缺陷
。
例如,不规范拍摄导致的字符形变
、
字符读数区域极端纵横比
、
字符部分遮挡等问题
。
本专利技术使用了两种“增强残差结构”作用于检测模型的主干,来提高检测模型的感受野,并使用优化
ELAN
来增强特征图的交互,之后将融合后的网络使用二阶注意力来引导模型学习,强化网络检测能力,提高对字符区域的精准检测
。
在后续识别中,产生形变和部分遮挡的字符会对识别结果产生较为严重的影响,采用调整后的
EfficientNetv2
作为主干网络,并针对字符部分遮挡问题,使用了字符细粒度识别来提高对字符局部特征的关注
。
在对不规范拍摄的水表盘进行识别时,可以应用检测模型检测出读数区域,并将读数区域交由后续的识别模型进行正确识别
。
[0031]本专利技术公开一种基于深度学习的字轮式表盘读数识别方法,识别方法包括步骤:
[0032]采集包含表盘读数区域的图像;
[0033]通过检测模型识别表盘的字符区域位置;
[0034]通过识别模型对字符区域的字符进行识别;
[0035]输出识别模型识别的字符,完成识别
。
[0036]对于上述的识别方法,其基于深度学习和图像处理技术实现的,具体分为两部分:读数区域检测模型和字符识别模型
。
检测模型的作用是对原始水表图像的读数区域进行检测,并提取检测区域
。
当水表图像输入到检测模型中时,模型的主干网络会提取水表图像的特征,然而,不规范的拍摄会造成读数区域纵横比过大,导致现有的模型检测不全的情况发生,这会直接造成识别模型的识别结果与真实结果不匹配的情况
。
现今的水表识别模型并
未针对此问题做出有效的改进
。
本算法对此情况,提出了两种“增强残差结构”来扩大模型的感受野,并以此搭建了一个
19
层的特征提取网络,使之能更好的处理这类不规范拍摄造成的检测区域;水表的大小
、
形状不一,所反映到图像上也不尽相同,多尺度特征是检测模型中重要的一环,现有的技术多以不同尺度的特征图融合来解决图像上不同大小的检测目标,本算法额外使用了优化
ELAN
结构来强化特征的交互,提升小目标的漏检;最后,利用二阶注意力对融合后的特征图进行权重分配,并将生成的特征图用于字符区域的预测
。
此模型本申请中命名为二阶注意力多特征增强融合网络
(Second
‑
order attention multi
‑
feature enhancement fusion network
,
SAMEFNet)。
[0037]所述检测模型包括:
[003本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种基于深度学习的字轮式表盘读数识别方法,其特征在于,识别方法包括步骤:采集包含表盘读数区域的图像;通过检测模型识别表盘的字符区域位置;通过识别模型对字符区域的字符进行识别;输出识别模型识别的字符,完成识别
。2.
如权利要求1所述的一种基于深度学习的字轮式表盘读数识别方法,其特征在于,所述检测模型包括:特征识别模块,所述特征提取模块对采集包含表盘读数区域的图像进行预处理,提取特征图;特征交互模块,所述特征交互模块将多个特征图进行特征交互;融合模块,所述融合模块将不同特征图进行采样融合,特征融合中使用二阶注意力来完成特征图权重的分配;预测模块,所述预测模块整合融合模块信息,对字符区域位置进行识别
。3.
如权利要求1所述的一种基于深度学习的字轮式表盘读数识别方法,其特征在于,所述识别模型包括:特征提取模块,所述特征提取模块...
【专利技术属性】
技术研发人员:吴英,陈浩辰,伍建全,翟渊,
申请(专利权)人:重庆科技学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。