刀具图像识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38262681 阅读:12 留言:0更新日期:2023-07-27 10:22
本发明专利技术实施例公开了刀具图像识别方法、装置、计算机设备及存储介质。所述方法包括:获取待识别图像;将所述待识别图像输入至类型识别模型中进行种类识别,以得到识别结果;其中,所述类型识别模型是通过若干个带有种类标签的刀具图像作为样本集训练卷积神经分类网络所得的,其中,所述类型识别模型包括卷积层、池化层、全连接层以及残差块,在每个卷积层和残差块的后面插入空间注意力模块。通过实施本发明专利技术实施例的方法可实现解决其他空间注意力机制模型学习到维度空间信息不够紧密的问题,提高种类和型号多的刀具的识别速度和精度。种类和型号多的刀具的识别速度和精度。种类和型号多的刀具的识别速度和精度。

【技术实现步骤摘要】
刀具图像识别方法、装置、计算机设备及存储介质


[0001]本专利技术涉及深度学习,更具体地说是指刀具图像识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]在产品生产过程中需要使用刀具进行产品的切削,由于工艺需要,一个产品的生产流程中需要多种规格的刀具,但是在目前的流水线上,常采用人工选择刀具安装至机床上对产品进行切削,切削完成后人工归还至指定刀具位置,这种人工选择刀具的方式具有较高的误选概率和管理错乱等问题。
[0003]现有技术中记载了多种智能刀具管理柜,以解决刀具智能管理的问题。但是,现有智能刀具管理柜一般都是依靠用户借用时输入的刀具信息和预设刀具位置来管理刀具,归还刀具时,用户需根据管理柜的指示将刀具放入指定空间内,再依靠柜体内部的机械分类来完成刀具类型识别和存放,这种刀具识别方式并不智能,很容易出现刀具信息识别不准确而导致分类错误的问题。当然,现有也有采用刀具图像识别技术来实现刀具的识别,进而进行刀具管理的,在刀具图像识别技术中,在已有的卷积神经分类网络中插入注意力模块提升算法的识别效果,已成为重要的研究方式。以Coorfinate Attention空间注意力模块为例,大致包括以下步骤:对上一层输出的特征图分别进行H维度和W维度的池化,得到C
×
H
×
1、C
×1×
W两特征图;将获得的特征图进行拼接,并使用C
×1×1×
(C/r)卷积核进行卷积。该步骤目的对空间信息进行编码,并在C通道上进行降维;对上一步骤的输出批归一化处理,并进行split切分,还原为两个支路;两支路各自使用卷积为(C/r)
×1×1×
C进行卷积学习,输出通道数还原成第一个步骤生成的通道数C;将支路输出进行激活后,把空间信息通过在通道上加权的方式融合。由此可见,第二步骤和第四步骤均使用卷积核为1
×
1的卷积,主要从通道维度上学习空间信息,没有充分利用W和H两个空间维度上自身维度紧密的关联;而且第二步骤在对W和H空间信息提取共享同一个1
×
1的卷积核,在各自维度上学习到注意力不够紧密。由于刀具的种类和型号非常多,若采用上述传统注意力机制来识别刀具,识别速度和精度都不高。
[0004]因此,有必要设计一种新的方法,实现解决其他空间注意力机制模型学习到维度空间信息不够紧密的问题,提高种类和型号多的刀具的识别速度和精度。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的缺陷,提供刀具图像识别方法、装置、计算机设备及存储介质。
[0006]为实现上述目的,本专利技术采用以下技术方案:刀具图像识别方法,包括:
[0007]获取待识别图像;
[0008]将所述待识别图像输入至类型识别模型中进行种类识别,以得到识别结果;
[0009]其中,所述类型识别模型是通过若干个带有种类标签的刀具图像作为样本集训练
卷积神经分类网络所得的,其中,所述类型识别模型包括卷积层、池化层、全连接层以及残差块,在每个卷积层和残差块的后面插入空间注意力模块。
[0010]其进一步技术方案为:所述将所述待识别图像输入至类型识别模型中进行种类识别,以得到识别结果,包括:
[0011]将所述待识别图像输入至类型识别模型中,利用类型识别模型中的卷积层获取所述待识别图像的特征图;
[0012]利用空间注意力模块获取所述待识别图像在宽度和高度上的注意力,并对所述待识别图像的精确位置信息进行编码;
[0013]将所述特征图分为宽度和高度两个方向,并分别进行全局平均池化,以得到宽度方向的特征图和高度方向的特征图;
[0014]对宽度方向的特征图和高度方向的特征图做铺平操作,以得到两个一维向量;
[0015]将两个一维向量输入至全连接层,以得到两路输出结果;
[0016]对两路输出结果进行维度恢复,并分别复制扩展,以得到两个相同的C
×
H
×
W的特征层,其中,W为宽坐标维度,H为高坐标维度,C为通道数;
[0017]将两个相同的C
×
H
×
W的特征层进行点积,以得到初步的三维空间注意力权重;
[0018]将初步的三维空间注意力权重进行空间信息融合,以得到最终的空间注意力编码权重;
[0019]将所述最终的空间注意力编码权重与所述待识别图像的特征图融合,以得到识别结果。
[0020]其进一步技术方案为:所述将两个一维向量输入至全连接层,以得到两路输出结果,包括:
[0021]将两个一维向量输入至全连接层的bottleneck结构,以得到两路输出结果。
[0022]其进一步技术方案为:所述两路输出结果为S
h
=σ(W2ReLU(W1Z
h
)以及S
w
=σ(W3ReLU(W4Z
w
),其中,为H维度方向的第一层全连接层的权重;为H维度方向的第二层全连接层的权重;为W维度方向的第一层全连接层的权重;为W维度方向的第二层全连接层的权重;Z
h
、Z
w
分别为两个一维向量,ReLU、σ为深度学习的激活函数,第一个全连接的降维系数为r是个超参数,第一个全连接的降维系数采用ReLU激活;最后一个全连接层恢复C
×
H
×
W的维度,在将学习到的特征上做σ激活;W为宽坐标维度,H为高坐标维度,C为通道数。
[0023]其进一步技术方案为:所述将初步的三维空间注意力权重进行空间信息融合,以得到最终的空间注意力编码权重,包括:
[0024]使用3
×
3卷积对初步的三维空间注意力权重进行编码,并使用Sigmoid激活,得到最终的空间注意力编码权重。
[0025]其进一步技术方案为:所述将所述最终的空间注意力编码权重与所述待识别图像的特征图融合,以得到识别结果,包括:
[0026]将所述最终的空间注意力编码权重与所述待识别图像的特征图进行点乘,以得到识别结果。
[0027]本专利技术还提供了刀具图像识别装置,包括:
[0028]图像获取单元,用于获取待识别图像;
[0029]识别单元,用于将所述待识别图像输入至类型识别模型中进行种类识别,以得到识别结果;
[0030]其中,所述类型识别模型是通过若干个带有种类标签的刀具图像作为样本集训练卷积神经分类网络所得的,其中,所述类型识别模型包括卷积层、池化层、全连接层以及残差块,在每个卷积层和残差块的后面插入空间注意力模块。
[0031]其进一步技术方案为:所述识别单元包括:
[0032]特征层获取子单元,用于将所述待识别图像输入至类型识别模型中,利用类型识别模型中的卷积层获取所述待识别图像的特征图;
[0033]编码子单元,用于利用空间注意力模块获取所述待识别图像在宽度和高度上的注意力,并对所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.刀具图像识别方法,其特征在于,包括:获取待识别图像;将所述待识别图像输入至类型识别模型中进行种类识别,以得到识别结果;其中,所述类型识别模型是通过若干个带有种类标签的刀具图像作为样本集训练卷积神经分类网络所得的,其中,所述类型识别模型包括卷积层、池化层、全连接层以及残差块,在每个卷积层和残差块的后面插入空间注意力模块。2.根据权利要求1所述的刀具图像识别方法,其特征在于,所述将所述待识别图像输入至类型识别模型中进行种类识别,以得到识别结果,包括:将所述待识别图像输入至类型识别模型中,利用类型识别模型中的卷积层获取所述待识别图像的特征图;利用空间注意力模块获取所述待识别图像在宽度和高度上的注意力,并对所述待识别图像的精确位置信息进行编码;将所述特征图分为宽度和高度两个方向,并分别进行全局平均池化,以得到宽度方向的特征图和高度方向的特征图;对宽度方向的特征图和高度方向的特征图做铺平操作,以得到两个一维向量;将两个一维向量输入至全连接层,以得到两路输出结果;对两路输出结果进行维度恢复,并分别复制扩展,以得到两个相同的C
×
H
×
W的特征层,其中,W为宽坐标维度,H为高坐标维度,C为通道数;将两个相同的C
×
H
×
W的特征层进行点积,以得到初步的三维空间注意力权重;将初步的三维空间注意力权重进行空间信息融合,以得到最终的空间注意力编码权重;将所述最终的空间注意力编码权重与所述待识别图像的特征图融合,以得到识别结果。3.根据权利要求2所述的刀具图像识别方法,其特征在于,所述将两个一维向量输入至全连接层,以得到两路输出结果,包括:将两个一维向量输入至全连接层的bottleneck结构,以得到两路输出结果。4.根据权利要求3所述的刀具图像识别方法,其特征在于,所述两路输出结果为S
h
=(W2ReLU(1Z
h
)以及s
w
=(W3ReLU(4Z
w
),其中,),其中,为H维度方向的第一层全连接层的权重;为H维度方向的第二层全连接层的权重;为W维度方向的第一层全连接层的权重;为W维度方向的第二层全连接层的权重;Z
h
、Z
w
分别为两个一维向量,ReLU、σ为深度学习的激活函数,第一个全连接的降维系数为r是个超参数,第一个全连接的降维系数采用ReLU激活;最后一个全连接层恢复C
×
H
×
W的维度,在将学习到的特征上做σ激活;W为宽坐标维度,H为高坐标维度,C为通...

【专利技术属性】
技术研发人员:张少特张奇特谭云培袁兴泷王兵正谢万桥
申请(专利权)人:杭州鄂达精密机电科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1